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本书为大学计箅机专业核心课程算法设计与分析教材。全书以算法设计策略为知识单元，系统介绍算法 
设计方法与分析技巧。主要内容包括:算 法槪述 、递归与分治策略、动态规划、贪心算法、回溯法、分支限界法、 
概率算法、线性规划与网络流、 NP 完全性理论与近似算法等。书中既涉及经典与实用算法及实例分析，又包 
括算法领域热点追踪。 
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件和其他教学参考资料(包括习题解睡思路提示和上机实验安排等 h 任课教师可按前言中所提供的方式索 
取。 
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新版说明 


由中国计算机学会教育专业委员会和全国高等学校计算机教育研究会(简称“两会”)组织 
和推荐，自1996年起电子工业出版社出版了基丁 CC1991 教程的15本系列教材，该系列教 
材受到髙校师生和读者的普遍欢迎和肯定，其中有II本人选1996 — 2000年全国 T: 科电子类 
专业规划教材。 

几年过去了，计算机学科又有了很大发展。 IEEE- CS/ACM 联合计算教程专题组，组织 
世界各国〗50多位专家，历时3年多，在美、欧、亚召开了一系列会议，在 CC1991 的基础上，发 
布了 “Computing Curricula 2001 - Computer Science Final Report” （简称 CC2001 ) c 专家们认 

为 :随着 计算机学科技术的迅速发展，使得现有的任何一所学校的计算机专业都很难再像 
CC1991 所提到的那样，能够覆盖计算机学科的所有知识领域。所以，需按市场需求将计算机 
学科划分为4个主要分支 :计算 机科学、计算机工程、软件工程和信息系统。其中计算机科学 
是各分支的基础， CC2001 正是基于计算机科学制订的。我国“两会”追踪 CC2001, 经过3年多 
的工作，最后以中国计算机科学与技术教程2002研究组的名义推出了 “China Computing Cur¬ 
ricula 2002”(简称 CCC2002) o CC2001 与 CC1991 比较有以下几个方面的 变化： 

(1) 将 CC1991 确定的[〖个主领域扩展为14个主领 域:离 散结构、编程基础、算法与复杂 
性、计算机组织与体系结构、操作系统、网络计算、编程语言、人-机交互、图形 学与可 视化计 
算、智能系统、信息管理、职业与社会问题、软件工程、数值 计箅。 对各主领域的名称、核心内容 
及选学内容都进行了调整和扩充。 

(2) 提出了课程的组织结构和实现策略。课程分为3类 :人门 （基础)课程、核心(必修)课 
程和附加(选修)课程。人门课程可按编程、算法和硬件优先等多种方式组织，使学生能够接触 
到计算机系统的设计、构造和应用，为学生提供实用性的技能训练，同时还应提高学生的兴趣 
和 智慧; 核心课程的组织可按传统、压缩、系统或网络方法进行，特别强调贯彻 CC1991 提出的 
3个过程、12个重复概念、职业与社会的关系等方法论思想;此外，还应设置一些介绍热门或前 
沿技术的附加课程。 

(3) 更加强调学生的专业实践，要求把专业实践放在重要位置，并贯穿于教学的全过程。 
这次对系列教材的全面修版，力求反映计算机学科发展的最新成就，并力争符合 CC2001 

和 CCC2002 所提出的要求及高校课程和教学改革的需要。这套教材的对象为本科生、研究生 
和大专生(通过删减使用）。信息技术领域的从业人员也可使用。 

为了保证编审和出版质量，编委会进行了调整，电子工业出版社成立了编辑出版小组。在 
原教材工作的基础上，编委会对教材大纲逐一进行了认真讨论和评审，其中一些关键性和难度 
较大的教材还进行了多次讨论和修改。 

限于水平和经验，教材中还会存在缺点和不足，希望读者提出中肯的批评和建议。读者可 
以通过电子工业出版社华信教育资源网站 http://www. hxedu.com.cn 反馈信息并发表意见， 

我们在此表示衷心的感谢！ 
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计算机的普及极大地改变了人们的生活。 E 1 前，各行业、各领域都广泛采用了 HIT 机信息 
技术，并由此产生出开发各种应用软件的需求。为了以最少的成本、最快的速度、最好的质量 
开发出适合各种应用需求的软件，必须遵循软件工程的原则。设计一个髙效的程序不仅需要 
编程小技巧，吏需要合理的数据组织和清晰高效的算法，这正是计算机科学领域数据结构与算 
法设计所研究的主要内容。一些著名的计算机科学家在冇关计筧机科学教育的论述中认为， 
计算机科学是一种创造性思维活动，其教育必须面向设计。计算机算法设计与分析 正是一 n 
面向设计,且处于计算机学科核心地位的教育课程。通过对计算机算法系统的学习与研究•，: 
握算法设计的主要方法，培养对算法的计算复杂性正确分析的能力，为独立设计算法和对算法 
进行复杂性分析奠定坚实的理论基础,对每一位从事计算机系统结构、系统软件和应用软件研 
究与开发的科技工作者都是非常重要和必不可少的。为了适应21世纪我国培养计算机各类 
人才的需要，本课程结合我国髙等学校教育工作的现状，追踪国际计算机科学技术的发展水 
平，更新了教学内容和教学方法，以算法设计策略为知识单元，系统地介绍计算机算法的设计 
方法与分析技巧，以期为计算机专业的学生提供一个广泛扎实的计算机算法知识基础= 

本书第2版修正了第1版中已发现的一些错误，并将第1版的第8章和第9章合并为第9 
章，增加了第8章线性规划与网络流算法的有关内容。 

全书共分9章，第1章介绍算法的基本槪念，并对算法的计算复杂性和算法的描述作了简 
要 阐述。 然后围绕算法设计常用的基本设计策略组织了第2章至第9章的内容。 

第2章介绍递归与分治策略，它是设计有效算法最常用的策略，也是必须掌握的方法。 

第3章是动态规划算法，以具体实例详述动态规划算法的设计思想、适用性以及算法的设 
计 要点。 

第4 章 介绍贪心算法，它也是一种重要的算法设计策略，它与动态规划算法的设计思想有 
一定的联系，但其效率 更髙。 按贪心算法设计出的许多算法能导致最优解。其中有许多典型 
问题和典型算法可供学习和使用。 

第5章和第6章分别介绍回溯法和分支限界法。这两章所介绍的算法适合于处理难解问 
题。其解题思想各具特色，值得学习和掌握。 

第7章介绍概率算法，对许多难解问题提供/髙效的解决途径，是有很高实用价值的算法 
设计策略。 

第8章介绍实用性很强的线性规划与网络流算法。许多实际应用问题可以转化为线性规 

划和网络流问题，并可用第8章中的算法有效求解。 

第9章首先介绍计算模型、确定性和非确定性图灵机，然后进一步深人介绍 N P 完全性理 
论和 NP 难问题的近似算法，这是当前计算机算法领域的热点研究课题，具有很高的实用 

价值。 

在本书各章的论述中，首先介绍一种算法设计策略的基本思想，然后从解决 H 算机科学和 
应用中的实际问题入手，由简到繁地描述儿个经典的精巧算法。同时对每个算法所需的时间 
和空间进行分析，使读者既能学到一些常用的精巧算法，乂能通过对算法设计策略的反复应 
用，牢固掌握这些算法设计的基本策略，以期收到融会贯通之效。在为各种算法设计策略选择 
用于展示其设计思想与技巧的具体应用问题时，本书有意軍复选择某些经典问题，使读者能深 
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刻地体会到一个问题 町 以用多种设计策略求解， 同时 通过对解问一问题的不冋算法的比较, 
使读者更容易体会到每•种具体算法的设计要点。随宥本书内容的逐步展开，读者也将进一 
步感受到综合应用多种设计策略可以电有效地解决问题。 

本书采用面向对象的 C + +语言作为算法描述手段,在保持 C + +优点的同时，尽量使算 
法描述简明、 清晰。 

为便于学习，我们在章首增加了学4要点提示，在章末配有难易适度的习题。为便于教 
学，本教材将免费提供电子课件和其他教学参考资料(包括习题解题思路提示和上机实验安排 
等) d 请任课教师登录电子工业出版社华信教育资源网 http :// www . hxedu.com .cti 或直接联 
系教材服务部 010-68152204 索取 c 

在本书编写过程中，得到了全国髙等学校计算机专业教学指导委员会的关心和支持。福 
州大学“211工程 ”计算 机与信息工程重点学科实验室为本书的写作提供了优良的设备和工作 
环境。电子工业出版社负责本书编辑出版工作的全体同仁为本书的出版付出 f 大暈辛勤的劳 
动，他们认真细致、一丝不苟的工作精神保证了本书的出版 质量。 傅清祥教授在百忙之中认真 
审阅了全书 ，提 出了许多宝贵的改进 意见。 在此，谨向每一位曾经关心和支持本书编写 T 作的 
各方面人士表示衷心的 谢意！ 

由于作者的知识和写作水平有限，书稿虽几经修改，仍难免有缺点和错误。热忱欢迎同行 
专家和读者批评指正，使本书在使用中不断得到改进，日臻完善。作者 E-mail： wangxd@fzu. 
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第 1 章算法概述 


学习要点 

，理解算法的概念 

• 理解什么是程序，程序与算法的区别和内在联系 
• 掌握求解问题的基本步骤 

-掌握算法在最坏情况、最好情况和平均情况下的计算复杂性概念 
■ 掌握算法复杂性的漸近性态的数学表述 
• 掌握用 C + +语言描述算法的方法 

1.1 算法与程序 

对于计算机科学来说，算法 （ Algorithm ) 的概念是至关重要的。例如在_外大型软件系统 
的开发中，设汁出有效的算法将起决定性的作用。通俗地讲，算法是指解决问题的一种方法或 
一个过程。更严格地讲，算法是由若千条指令组成的有穷序列，且满足下述儿条 性质： 

( 1 ) 输人:冇零个或多个由外部提供的量作为算法的输人。 

(2) 输出 :算法 产生至少一个量作为输出。 

(3) 确定性:组成算法的每条指令是清晰的，无歧义的。 

(4) 有限 性:算 法中每条指令的执行次数足有限的，执行每条指令的时间也是有限的， 
程序 ( Program ) 与算法不同。程序是算法用某种程序设计语言的 it 体实现。程序可以不满 

足算法的性质(4)。例如操作系统，它是一个在无限循环中执行的程序，因而不是一个算法。然 
而我们可把操作系统的各种任务看成是一些单独的问题，每-个问题由操作系统中的一个子 
程序通过特定的算法來实现。该子程序得到输出结果后便终止 u 

描述算法吋以有多种方式，如自然语言方式、表格方式等。在本书中，我们采用 C ++ 语言 
来描述算法 。 C ++ 语言的优点是类型丰富、语句精练，具有面向过程和面向对象的双電持点。 
用 C 来描述算法可使整个算法结构紧凑，可读性强。在本书中，有时为了更好地阐明算法 
的思路.我们还采用 C ++ 与自然语 H 相结合的方式来描述算法 

1.2 算法复杂性分析 

一 个算法的复杂性的卨低体现在运行该算法所需要 的计算 机资源的多少 h , 所需资源越 
多，我们就说该算法的复杂性 越高; 反之，所需资源越少，我们就说该算法的复杂性越低。最重 
要的计算机资源是时间和空间（即存储器）资源。因此，算法的复 杂性存 时间复杂性和空间复 
杂性之分。 

不肓而喻，对于任意给定的问题，设计出复杂性尽可能低的算法是我们在设计算法时追求 
的一个重要13标。另一方面，当给定的问题已有多种算法时，选择其中复杂性最低者，是我们在 



选用算汰•时遵循的一个 虛 要准则因此， If 法的复杂件分析对兑法的设计或选用 有若黾 要的指 
导意义和实用价值。 

算法的复杂性足算法运行所需耍的汁算机资源的暈，耑要时 N 资源的 W 称为时间复杂性， 
需要的空间资源的量称为空间复杂性 。这个 m )_ v : 该笫中反映算法的效率，并从运行该算法的实 
际计算机中抽象出来。换句活说.这个 m 应该是只依赖 r •要解的问题的规模、算法的输人和筧 
法本身的函数。如果分別用 A _， /和4表示算法要解的问题的规模、笕法的输人和算法本身，而 
且用 c 表示复杂性，那么，应该有 c = f ，( yvw “ i ), 其中厂（〜，八 4) 娃一个巾~，/和4确定 
的三元函数。如果把时间复杂性和空间复杂性分开，并分別用 r 和 s 来表不，说该 有 ：: r = 
r (/ v ，/，/ i ) 和 s = W ，/,/0。 通常，我们让4隐含在复杂性函数名岿中，因而将 r 和 s 分 
别简写为 r =『（夂/)和5= s (. Y,/)o 

由于时间复杂性勻空间复杂性概念类同，方法相似， k 空 间复杂 性分析相对简单些， 
所以本书将主要讨论时间复杂性。现在的问题是如何将笈杂性函数具体化，即对于给定的/ V 、 
/和如何导 m mo 和 s ( A r ,/) 的数学表达式•来给出计算 n / v ，/) 和 s ( a .,/) 的法 
则。下面以 HA \/) 为例，将复杂性函数具休化。 

根据 T { N ， D 的概念，它应该是算法在-台抽象的计算机上运行所需要的时间。设此抽 
象的计算机所提供的元运算有4种，它们分别记为％。又设每 执行一 次这®元运 
算所需要时间分别为 ，…， ^对于给定的算法,4 ,设经统计，用到儿运算的次数为 
i = 1，2, …， MK 淸楚，对于每一个 M ^ i ^ he , 是/ V 和/的函数，即 q 二 q (. / V ，/)。那么有 

k 

t(n ， i) : 

. - ] 

其中=1，2,…， 幻是与 / V 和/尤关的常‘数。 

显然，我们不可能对规模 A •的每 - 种合法的输人/都去统汁 dV ,/)，/ = 1，2,…上因此 
T(NJ) 的表达式还要进一步简化，或者说，我们只能在规模为 A 的某些或某类有代表性的 
合法输入中统计相应的= 1，2,…， I 评价其时间复杂性。 

本书只考虑=种情况下的时间复杂性，即最坏情况、最好情况和平均情况 F 的时间复杂 
性，并分别 iC 为 r _ u )、 r min (: v ) 和在数学上有 

k * 

T m JI\) : mad (: V ，/)二 max 2^ (A,/) - V/^(A r ,/^) - r(,V,r ) 

、二 1 : = 1 

k k 

T m]n (N) = mmT(NJ) = min 2 ⑷ （ V， /) = V ； ^ r ( ， V,7) = 

fhD .\ t= t 

nr ，、 id d ', 

式中，/ > 、是 规模为 iv 的合法输人的 集合； /_ 是 / A 中-个使/’（/ V ,厂）达到 r _(/ v ) 的命法 

输人； 7是/ >. v 中■个使 rU , 7 ) 达到 r Tt]iri ( 的合法 输人; 而 p ( /) 足在算法的应用中出现 

输人/的概率。 

以上芑种情况下的时间复杂性从不冋角度来反映算法的效率，各冇其 M 限性，也各有各的 
用处。实践表明可操作性最好 R . 最有实际价值的是最坏情况 F 的时间复杂性:本书对算法的时 
间复杂性分析的重点将放在这种情形卜. • 

随着经济的发展、社会的进步和科学研究的深入，要求 用计算 机解决的问题越来越复杂， 
规模越来越大，对求解这类问题的算法作复杂件分忻具有特别窀要的意义，因而要特别关注 。 



在此，我们引人复杂性渐近件态的慨念。 

设 n ~) 是前面所定义的关法 d 的复杂性函数 一 般说来，当 a _’ 节调增加 a 趋 

时， T ( N ) 也将笮调增加 a 于、付 F " V )，如果存在歹 （; V ). 使得$ A _ •， CC 时有 （ T ( N )- 

f ( N ))/ T ( N ) ，0,那么，我们就说 f ( N)^h T ( N ) 当 /V — «时的渐近性态，或叫亍 （ /V ) 

为算法4当 A _ — oo 的渐近复杂性而与 7 T (/ V ) 相区别因为在数学上，？ U ) 是7(: V ) ^ 

/V — cc 时的渐近衣达式，立观上， T (~)是 r ( iv ) 中略去低阶项所留下的主项，所以它无疑 

比 r ( iV ) 来得简单：比如当 n / V ) = 3 A _ 2 + 4/ Vlf ) gN +7时，？ ' (」 V ) 的一个答案是 3 iV 2 , 因为 
这时有 

- ? ( A 0 )"L - + - ? — >0(^ 吋） 

3 /V + 4 /V Jog A 1 + 7 

a 然， IV 2 比 3/\ 2 + 4 Mog ：\ + 7 简单得多（ 

由于当 ； v — «时，渐近 f ?( A _)， 我们有理由用 t : Y ) 来替代 H A ) 作为算法」 

在 t 时的复杂性的度暈。而 k 由于 r (/ v ) 明1地比 n ； v ) 简单，这种替代迠对复杂性分 
析的一种简化。进一步考虑到分析算法的复杂性的目的在于比较求 解同一 问题的两个不同算 
法的效率/而汽要比较的两个算法的渐近复杂性的阶+相问时，只要能确定出各自的阶，就可 

以判定哪一个算法的效率高.:换句话说，这时的渐近复杂性分析只要关心 r ( A 0 的阶就够了， 

不必关心包含在 T ( A 0 中的常数因子。所以，我们常常乂对7 ’ （A ) 的分析进-步简化，即假 
设算法中用到的所有不同的元运算各执行一次所需要的时问都足一个笮位时 问:. 

综上所述， 我们己 经给出 f 简化算法复杂性分析的方法和步骤，即只要考察当问题的规模 
充分大时，算法复杂性在渐近意义下的阶。本书的算法分析都将这么做。为此引人以> 渐近意 
义下的记9 仏和〜 

以下设 /( A 0 和 gU ) 足定义在 1 E 数集 t 的正函数。 

如果存在 E 的常数(:和 fi 然数 A 。， 使得当 A > A r o n ^ i /( AO ^ C ^(, V ), 则称函数 /( / V ) 
当凡充分大时上有界， ny / v ) 是它的一个上界，记为 /(; v ) : o ( g Gv ) h 这时我 n 还说 
/ U ) 的阶不高于纟 U ) 的阶。 

举几个例 

(1) 因为对所有的~為1冇 3' 矣 4 A \ 我们有 3 /V = 0(. \)； 

(2) 因为当 /V 会 1 时有 + 1024矣 1025 A ， 我们有 /V + 1024 = 0{ N ); 

(3) 冈为当 /V 彡 10时有 2_ V 2 + 11 A . - 10矣 3 W 2 , 我们有 2/ V 2 + 11 A : - 10 = 0( A - 2 ) ； 

(4) 因为对所冇 W 英1有/ V 2 矣我们有妒= 0( yV 3 ); 

(5) 作为一个反例# 一 0( . V 2 ):闪为若不然，则存在 TF 的常数 C 和自然数乂，使得当 /V 
^ / V D 有 iV 3 $ C ; V - , up A ' ^ C 。 显然，当取 ；V = maxLV 0 ._ C _ + 1! 时这个不等式不成立，所 
以 / V 3 ， 0(； V 2 )o 

按照符号0的定义，容易证明它冇如下运算 件质： 

⑴ 0{ f ) -0( g ) = 0{ rm\\{f yg ))^ 

⑵ 0(f) + 0(g) - 0(/+ g),-y 

(3) 0(/)0( g ) = 0( fg ). 


■ 3 • 



(4) 如果 〆 :V) = 0(f(N))M 0(f) + 0(g) = 0(f), 

(5) o(Cf(NY) = o(/(yv ))， 其巾 CJ2 ： •个正的常数 c 

(6) / - 0 (fh 

性质 (1) 的证 明：设 / (.V) = 0(/) 。根据符号 0 的定义，存在正常数 q 和自然数％，使 
得对所有的 W 彡 A 〗 • 冇 /V) 莓 C x f{ N) . 

类似地，设 C(N) : 0(#) ，则存在正的常数 ^ 和自然数 /V 2 ，使得对所有的 /V 多乂有 
G(N) ^ C 2 g(i\). 

令 C 3 二 max { C 1 » C 2 \ , A '3 ^ niax 丨八 _ 】，/ V 2 i ， /i ( A’ ） = max j/, ^ i c 则对所有的 A 彡 乂 ，有 

F(A .) 矣 C x f{N) ^ ( ： M^) ^ C 2 h( 1 \) 

类似地，有 

(r(^) ^ C 2 f(N) ^ C 2 h(N ) 安 C 3 h(N) 

因而 

0(f) + 0(g) ^ f(N) + r;(A0 

= 2C 3 /i(/V) 

= 0 ( h ) 


; 0(max( f , g)) 

其余性质的证明类似，留给读者作为练习 c 

应该指出，根据符 9 0 的定义，用它评估算法的 S 杂性，得到的只是当规模充分大时的一 


个上界。这个上界的阶越低则评估就越精确，结果就越有价值 

关于符号文献里有两种不问的定义。本书 U 采用其中的一种，定义如下 ■.如 果存在正的 
常数 C 和自然数仏，使得当 % 时有 /( 八） 為 &( 斤），则称函数 /( /V) 当 /V 充分大时下 
有界 ; 且是它的一个下界， iC 为 f{N) : r2(g(A0) 。 这时我们还说 f{N ) 的阶不低于 
g{N) 的阶。 D 的这个定义的优点是与 0 的定义对称，缺点是当 /( A') 对 A 然数的不同无穷子 
集有不同的表达式，且有不同的阶时，不能很好地刻画出 f(N) 的下界。比如当 

rioo _/v 为正偶数 

’、、’ 16/V 2 ..Y 为 IH 奇数 


时，按上述定义，得到 /(ao - mi) ， 这是一个平凡的下界，对算法分析没有什么价值。然而， 
考虑到上述定义有与符号 0 定义的对称性 ，本书 还是选用它。 


RJ 样地，用 D 评估算法的复杂性，得到的只是该复杂性的一个下界。这个下界的阶越髙， 
则评估就越精确，结果就越有价值。再则，这里的只对问题的一个算法而言。如果它是对一 
个问题的所有算法或某类算法而言，即对于一个问题和任意给定的充分大的规模 /V ，下界在 
该问题的所有算法或某类算法的复杂性中取，那么它将更有意义。这时得到的相应下界，我们 
称之为问题的下界或某类算法的下界：它常常与符号 0 配合以证明某问题的一个特定算法是 
该问题的最优算法或该问题的某算法类中的最优算法。 


我们定义 /( A _ ) =外貧，（八））当 R 仅当/(/ V ) = 0 ( g ( N )) R . f ( N ) = m 《（ A 0) c 这时， 
我们说/(/ V )与 〆 : V )同阶 :• 

最后，我们来看符 V 0的定义。如果对于任意给定的 e > 0,都存在正整数/ V 。，使得当 
/V 孑％ 时有 /(A，)/〆 AO < h 则称函数/(々）当 /V 充分大时的阶比 〆 /V) 低，记为 
/(/V) = o(g(N)), 


• 4 • 



例如 + 7 = o(3 /V 2 + 4AIug^ + 7) c . 


习题1 

M 求下列函数的渐近表达式： 

3 n 2 + \0 n ; n 2 / li ) + 2 n ; 21 + i // 2 ； log ^ i 3 ; 1 01og 3 n , 

1-2 试论6>(1)和 0(2) 的 K 别 

1-3 画出 K 列表达式的函数图像，并说明各表达式当 a 在什么范围内取值时效率最高， 

4n 2 , log n 9 3 n , 20n , 2 ， n 2/3 

1-4 按照渐近阶从低到高的顺序排列以下表达式 : 4，，10^，3\207〖，2,，'又，/!应该 
排在哪 -位 7 

卜5 (I)假设某算法在输人规模为 n 时的计算 时间为 T ( n ) = 3x 2'、在某台 U ‘貰机 h 
实现并完成该算法的时间为 （ 秒。现冇另一台计算机，其运行速度为第一台的64倍，那么在这 
台新机器上用同-算法在£秒'内能解输人规模为多大的问题？ 

(2) 若上述算法的计算时间改进为 TU ) = « 2 ,其余条件不变，则在新机器上用 f 秒时间 
能解输人规模为多大的问题？ 

(3) 若上述算法的计算时间进一步改进为 T ( n ) = 8,其余条件不变，那么我们在新机器 
上用 f 秒时间能解输人规模为多大的问题？ 

1-6 硬件厂商 XYZ 公司宣称他们最新研制的微处理器运行速度为其竞争对亍 4BC 公 
祠同类产品的！00 倍:对 f 计算复杂性分別为心^和 d 的各算法，若用 ABC 公司的计算 
机在1小时内能解输人规模为《的问题，那么用 XYZ 公3的计算机在1小时内分别能解输人 
规模为多大的问题？ 

卜7对于下列各组函数 / U〉 和 gU)， 确定 /U) = 0(#U )) 或 / U) = D(gU )) 或 
f ( n ) = 外貧 U))， 并简述埋由。 

⑴ /( n ) = log/? 2 ; g ( n ) : \ o^n + fi 

(2) f { n ) - \ o ^ n 2 ; g ( n ) = d n 

(3) f { n ) - n ; gin ) = log 2 n 

(4) f ( n ) : «log；i + 7 i ； g ( n ) = log a 

(5) f ( n ) - 10; gin ) = log 10 

(6) f ( n ) - log 2 7i; g ( n ) = logrt 

(7) f ( n ) = 2 n ; g ( n ) ^ K )0 u 2 

(8) f ( n ) = 2"; g ( n ) = 3 R 

1 ~8 ilH 明：? 1! = o( n n )c 

1-9 下面的算法段用于确定 ^ 的初始值。试分析该算法段所需 ii 算日]间的 h. 界和 T 界。 

• • • 

while(n > 1 ) 
if( odd(n)) 

n = 3 ^ (i + 1 i 

else 


fi = ri/2 ； 



1-10 证明：如果一个算法在平均情况卜的 U 算时间复杂件为扒 / U ))， 则该算法在最 
坏情况下所需的计算时间为 n ( f ( n )). 



第 2 章 


递归与分治策略 


学习要点 

• 理解递归的概念 
• 掌握设计有效算法的分治策略 
• 通过下面的范例学习分治策略设计 技巧： 

(1) 二分搜索技术 

(2) 大整数乘法大整数乘法 

(3) Strassen 矩阵乘法 

(4) 棋盘覆盖 

(5) 合并排序和快速排序 

(6) 线性时间选择 

(7) 最接近点对问题 

(8) 循环赛日程表 

仟何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小，解 
题所需的计算时间往往也越少，从而也较容易处理。例如，对于 n 个元素的排序问题，当 n = 1 
时，不需任何计算= 2时，只要作一次比较即可排好序^ = 3时只要作两次比较即 》1 
而当^较大时，问题就+那么容易处理了。要想直接解决一个较大的问题,有时是相当困难的。 
分治法的设计思想是，将一个难以直接解决的大问题，分割成一些规模较小的相同问题，以便 
各个击破，分而治之 D 如果原问题可分割成 A 个子问题，1 < 〃，且这些子问题都可解，并可 

利用这些子问题的解求出原问题的解，那么这种分治法就是可行的。由分治法产生的子问题往 
往足原问题的较小模式，这就为使用递归技术提供丫方便。在这种倩况下，反复应用分治尹段, 
可以使子问题与原问题类型一致而其规模却不断缩小，最终使子问题缩小到很容易求出其解。 
这样，就 A 然导致递！ JI 算法的产生。分治与递! U 像一对孪牛兄弟,经常同时应用在算法设计之 
中，并由此产生许多高效算法。 

2.1 递归的概念 

一个直接或间接地调用自身的算法称为递归算法 。一 个使用函数自身给出定义的函数称 
为递归函数。在计算机算法设计与分析中，使用递归技术往往使函数的定义和算法的描述简捷 
且易于理解。有些数据结构如二叉树等，由于其本身固有的递归特性，特别适合用递归的形式 
来描述。还有一些问题，虽然其本身并没有明显的递归结构，但用递 W 技术来求解使设计出的 
算法简洁易懂 R 易于分析。下而我们来看几个实例。 

【例 2-1】 阶乘函数 
阶乘函数可递归地定义为 





^ - 0 
77 > 0 


阶乘函数的 0 变量 71 的定义域是非负整数。递归式的第一式给出了 这个函 数的一个初始 
值，是非递归定义的 r 每个递归函数都必须有非递归定义的初始值，否则，递归函数就无法计 
算。递归式的第二式延用较小自变量的函数值来表示较大 ft 变量的函数值的方式来定义《的 
阶乘。定义式的左 G 两边都引用了阶 乘记号 ，是一个递! U 定义式，吋递归地计算 如下： 


int Factoria](int n) 

I 

I 

I 

if (n = = 0) return 1; 
return n ^ Factorial(n - 】 ）； 


【例 2 - 2 】 F ibonacri 数列 

无穷数列 1，1,2,3.5,8,13,21,34,5 s ， …，称为 Fibcmacd 数列。它可以递归地定义为 


f(n) = 1 



^F(n - 1) + f(n - 2) a > 1 


这是一个递归关系式，它说明当 a 大于1时，这个数列的第 a 项的值是它前面两项之和。 
它用两个较小的自变量的函数值来定义一个较大自变量的函数值,所以需要两个初始值 F (0) 
和 F (\) 0 

第 n 个 Fibonacci 数可递 ! JH 地计算 如下： 

int Fibonacci (int n) 

s 

if ( n < = I) reLutn 1 ； 

return Fibonaw:i(n - 1) + Fibonacci(n - 2); 

t 

f 

I 

• ^ • • • • • % • • • • 

上述两例中的函数也可用如下非递 w 方式 定义： 

n ! = \ x 2 x 3 x x (n - \ ) x n 

叫=别¥广-(¥广) 

并非-切递归函数都能用非递归方式定义。为 /对递 u 函数的复杂性冇史多的了解，我们 
再介绍一个双递 W 函数——函数。当一个函数及它的一个变量是由函数3身定义 
时,称这个函数是双递归函数。 

【例2-3】 Ackerman 函数 

Ackerman 函数4 ( m ) 有两个独立的整变量 m 多0和？ i 在0,其定义如下： 


A(l y 0) = 2 

A (0 y m) - 1 
A (« , 0 ) = n + 2 

A(n , m) = A( A (n - l, m) y m - 1) 


m ^ 0 
n ^ 2 
n ^ m ^ \ 



4 U ， m ) 的价的每•个值都定义 f 一个单变暈函 数:. 

由递归式的第3式知 m = 0定义了函数“加2%, 

^ m = \ 时，由于 4(1,1) = /1(‘4(0，1)，0)二 *4(1,0) =： 2以及 /!(«,)) = A { A (n - 
I , i ) ,0) = A ( n - l ,1)+2( tt > l ) ，我们有 .4 ( ri , i ) = 2 n ( n ^ 1) ， 即 4 ( 几， 1) 是函数“乘 

当爪 = 2 时， ‘4 U ,2) = A { i{n - 1,2),1) = 2 AU - 1,2) •和 / Kl ,2) = 4(/ U ( U )， 
t ) = (1,1) = 2,故 /I ( r ? ,2) = 2 n ^ 

类似地可以推出 M U ，3) = 2 2 ’ ，其中 2 的层数为〜 

4 U ，4) 的增 K 速度非常快，以至于没存 适当的 数学式子来表示这一函数。 

单变量的 Ackerrmm 函数 4 U ) 定义为 MU ) = 4 U ，》)。其拟逆函数 & U ) 在算法复杂 
性分析中会遇到。它定义为： a ( «) = mini ! i 4(/ c ) 為 n 丨。即 a ( 7 i ) 是使/【备 A ( k ) 成立的最 
小的 A 值。 

例如，由 A (0) = 1，4(1) = 2, 4(2) =4和 -4(3) = 16推知 ，〆 1) = 0^(2) = Ua (3) 
= a (4) = 2和 〆 5) =…= a (16) = 3。可以看出的增长速度非常慢。 

/1(4) = 2 2 _ 2 (其中2的层数为65 536)。这个数非常大，我们无法用通常的方式来表达它。 

如果要写出这个数将需要 M / l (4)) 位，即2 2 ’ 2 (65 535层2的方幕）那么多位。所以，对于通 
常所见到的正整数〜我们有 a ( n ) 矣4。但在理论上 《 U ) 没有 h 界，随着 n 的增加，它以难以 
想像的慢速度趋向正无穷大 
【例 2 _4】排列问题 

设 i ? = i n , r 2 ，…， rj 是要进行排列的 n 个元素，足 : R _ IM 。 集合 A 中元素的全排 
列记为 Perm ( A ') 0 ( ) Perm ( X ) 表示在全排列 Perm ( Z ) 的每一个排列前加上前缀 r , 得到的 
排列。尺的全排列可归纳定义 如下： 

当 n = 1时， Perm (/0 = ( r )， 其中 r 是集合及中惟一的 元素； 

当 n > 1 时， Perm ( if ) 由 （ri ) Perm ( i {】） ， （ r2 ) Perm ( i ? 2 ) ，…， （) Perm (/ O 构成 c 
依此递归定义，町设计产生 Perm (/ f ) 的递归算法 如下： 


template < class Type > 

void Perm( Type lisl[ J, int k, int m) 

I // 产生 listLk:mj 的所有排列 

if (k = = m) 

i // 单元素序列 

for (int l = (); i < = m; i + +) 
cout < < listfij; 
cout < < cmil; 

I 

f 

else // 多元素序列，递归产生排列 

for (int j = k; i < = m; i + +) 


Swapdiiit kj, li?tLi ^); 
Perm(list ， k + 1 > rn ); 



Swap(listL k] , lislLi ])； 



template < class Type > 

inline vo id Swap(Type & a, Type & b) 

1 

Type temp = a; a = b; li - lemp ； 
i 

I 

• . ... . - . - . '• . 

算法 Perm ( li S t ， k ， m ) 递 H 地产生所有前缀是 list [0： *- l ], 且后缀是 list [ k : m ]^} 全排列 
的所有排列。函数调用 Perm ( list ,0^ - 1) 则产生 lisl[0:n - 1] 的全排列 c 

在一般情况下4 < 的。算法将[幻中每一个元素分别与 listU ] 中元素交换。然后 
递归地计算 HstU + 1: m ] 的全排列，并将计算结果作为的后缀□算法中 Swap 是用于 

交换两个变量值的内联函数。 

【例 2- 5】整数划分问题 

将一个正整数 n 表示成一系列正整数之和， 

a =…+ /12 +…+…（其中，汀1彡 "2 彡…芬〜彡1，4彡 1) 

正整数的一个这种表示称为正整数 U 的一个划分。正 整数" 的不同的划分个数称为正 

整数《的划分数，记作 pUh 

例如，正整数6有如下11种不同的划分，所以 〆 6) = 11。 

6; 

5 + 1; 

4 + 2, 4+1 + 1; 

3 + 3, 3 + 2+1, 3 + 1+1 + 1; 

2 + 2 + 2, 2 + 2+1 + 1,2+14-1 + 1 + 1; 

1 + 1 +1 + J + 1 + 1 o 

在正整数 n 的所有不同的划分中，将最大加数〜不大于 m 的划分个数记作 〆 a ， m ) c 我 
们可以建立如下递归关系。 

( 1 ) q( II y \) Z= i,n ^ 1 ; n 

当最大加数 tm 不大于 1 时，任何正整数 n 只有一种划分形式，即 n = “ 1十'"—+1。 

( 2 ) q{n,m) - q{n,n) y m ^ n; 

最大加数〜实际上不能大于〜因此 4 ( 1 ，爪）= i 

( 3 ) q(n^n) = 1 + q{ri y n - 1 ) ; 

正整数 n 的划分由〜 " 的划分和〜^ ^ - 1的划分组成。 

(4) q{a,m) - q{n,m - [) + q(n - m , m) > m > 1; 

正整数 ri 的最大加数〜不大于 m 的划分由〜 = m 的划分和〜在爪-1的划分组成。 
以上的关系实际上给出了计算 c / U , m ) 的递归式如下： 
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n < ra 


q(n,n) 

n = m 

q( n y m. - 1 ) ^ q{n - m , m) n > m > 1 

据此，可设计计 》 ? U，m) 的递! El 函数如下。 IH 整数 n 的划分数〆= q ( n、nh 

j • • • • 

int q( int ii, ini rn) 

I 

if ((n < 1) I I (m < 1)) return 0; 
if ((n = = 1) H (m = = 1)) return I ； 
if (n < m) return q(u.n); 
if (n = = m) return q(n，】n -1) + 1; 
return q(n，m - 1) + q(n - ni. m); 

I 

i 

• • • • • • I 

【例 2-6】 Hanui 塔问题 a b c 

设 4 ,B,C 是三个塔座。开始时，在塔座 /t 上有 
一叠共〃个圆盘，这些圆盘自下而上，由大到小地叠 
在一起，各圆盘从小到大编号为1，2，…， /I ,如图2 - 1 
所示 f 、现要求将塔座 A 上的这一叠圆盘移到塔座 S 

上，并仍按同样顺序叠置。在移动圆盘时应遵守以 T Himoi 塔间 题的初始状态 

移动 规则： 

规则 0) 每次只能移动一个 圆盘； 

规则 (2) 任何时刻都不允许将较大的圆盘压在较小的圆盘 之上； 

规则 (3) 在满足移动规则 （1) 和 (2) 的前提下，可将圆盘移至只 •(： 中任一塔座上 3 
这个问题有一个简笮的解法。假设塔座 A . B . C 排成一个三角形，4 — 5 — C 」构成 
一顺时针循环。在移动圆盘的过程中，若是奇数次移动，则将最小的圆盘移到顺时针方向的下 
一塔 座上; 若是偶数次移动，则保持最小的圆盘不动。而在其他两个塔座之间，将较小的圆盘移 
到另一塔座上去。 

上述算法简洁明确，可以证明它是正确的。下面我们用递归技术来解决同 • •问题 。当 n = 
1时，问题比较简单。此时，只要将编号为 i 的圆盘从塔座 A 直接移至塔座 i? h 即可。当^ > 1 
时，需要利用塔座(:作为辅助塔座。此时设法将〃 - 1个较小的圆盘依照移动规则从塔座4移 
至塔座 C， 然后，将剩下的最大圆盘从塔座4移至塔座 i?, 最后，再设法将 n - 1个较小的圆盘 
依照移动规则从塔座 C 移至塔座这样一来，〃个圆盘的移动 问题就 可分解为两次 n 1个圆 
盘的移动问题，我们又可以递归地用上述方法来做。由此设计出解 Hand 塔问题的递归算法如 
下： 

% • § • _ 馨,、 Si • • • • • • 

void Hanoi(int n, int A, int B，int C) 

I 

I 

I 

if (n > 0) ? 

Hanoi(n - 1. A, C,B )； 

Mrtve(n ， A, B); 

Hanoi(rs - 1 — C ， B ， A); ! 
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其中， j 表示将塔座 d h 白下而 h ， rtr 人到小叠在一起的^个圆盘依移动规 
则移至塔座上并仍按同样序叠排。在移动过程中，以塔座 C 作为辅助塔座。 Move (»，/ l ， 
i ?) 表示将塔座/4 t 编号为《的圆盘移至塔座 he 

算法 Hanoi 以递归形式给出，每个圆盘的 ft 体移动方式并不淸楚，因此很难用手工移动来 
模拟这个算法 。然而 ，这个算法易于理解，也容易证明其正确件，且比通常的算法有效。 

像 Hanoi 这样一个递归算法，在执行时需要多次凋用自身。实现这种递归调用的关键是为 
算法建立递归调用工作栈:、通常，在一个算法中调用另一算法时，系统需在运行被调用算法之 
前先完成三件事： 

(1) 将所有实参指针，返回地址等信息传递给被调用算法； 

(2) 为被调用算法的局部变量分配存 储区； 

(3) 将控制转移到被调用算法的人口。 

在从被调用算法返回调用算法时，系统也相应地要完成三件事： 

(1) 保存被调用算法的计算 结果； 

(2) 释放分配给被调用算法的数 据区； 

(3) 依照被调用算法保存的返冋地址将控制转移到调用算法:， 

当有多个算法构成嵌套调用时，按照后调用先返回的原则进行。上述算法之间的信息传递 
和控制转移必须通过栈来实现，即系统将整个程序运行时所耑的数据空间安排在一个栈中，每 
调用一个算法，就为它在栈顶分配一个存储区，每退出一个算法，就释放它在栈顶的存储 K 。 当 
前正在运行的算法的数据一定在栈顶。 

递归算法的实现类似于多个算法的嵌套调用，只是调用算法和被调用算法是问一个算法。 
和每次调用相关的一个重要概念是递归算法的调用层次 。若 调用一个递归算法的主算法为第 
0层算法，则从主算法调用递归算法为进入第1层调用；从第/层递归调用本算法为进入第 
1 + 1层调用。反之，退出第纟层递归调用，则返冋至第 i - 1层调用。为了保 iiE 递«调用正确执 
行，系统要建立一个递归调用工作栈，为各 层次的 调用分配数据存储区。每一层递归调用所需 
的信息构成一个工作 S 录，其中包括所有实参指针，所有局部变量以及返回上一层的地址。每 
进入一层递归调用，就产生一个新的工作 i 己录压人栈顶。每退出一层递! H 调用，就从栈顶弹出 
一个工作记录。 

图 2-2 是实现算法递 H 调用的栈使用情况示 
意。其中 TOP 是指向栈顶的指针。 

由 T 递归算法结构清晰,可读性强，且容易用 
数学归纳法证明算法的正确性，因此它为设计算 
法、调试程序带宋很大方便。然而，递 妇算 法的运 
行效率较低，无论是耗费的计算时间还是占用的 
存储空间都比非递归算法要多。若在程序中消除 
算法的递归调用，则其运行时间可大为节省。因 
此，冇时希望在一 t 递 IH 算法中消除递归调用，使 
其转化为一个非递归算法。通常，消除递归是采用 
一个用户定义的栈来模拟系统的递归调用工作 
栈，从而达到将递归算法改为非递归算法的的仅仅是机械地模拟还不能达到减少计算时间 
和存储空间的 B 的，还淘要根据 _ A ▲体程序的特点对递归调用工作栈进行简化，尽量减少栈操 
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图 2-2 递归调用工作栈示意图 




作， iii 缩栈存储空间以达到 节省汁 算时间和存储空间的 H 的。 

2.2 分治法的基本思想 

分治法的基本思想是将一个规模为/I的问题分解为 A 个规模较小的子问题，这些子问题 
互相独立 i 与原问题相同。递归地解这些子问题，然后将各子问题的解合并得到原问题的解 C 
它的一般的算法设计模式如下 •. 

* • • • • • 參 籲_ ■春 II 參 

Divide •and -Conqiier( P) 

i 

if ( I I 1 I < = nO) Adkoo( P); 

divide P into smaller subinstances 

P 1, P 2, …， Pk ; 

for (i - 1 ;i < = k;i + 十） 

yi = Divide -and -Conquer( Pi); 
return Merge( y 】 ， y2 ， • • 、 yk ); 

% • • • • • • • ■ 

其中， I P I 表示问题 P 的规模，为一阈值，表示当问题 P 的规模不超过 TlO 时, 问题已 容易解 
出，不必再继续分解。 Adhoc(P) 是该分治法中的基本子算法，用于直接解小规模的问题 Pc0 
此，当 P 的规模不超过 M 时，直接闬算法 Adhoc(P) 求解。算法]^听( > 1， ： ^2，"，，>)是该分治 
法中的合并子算法，用于将 P 的子问题 P〗，P2, …， PA: 的解 7 1，；>2,^合并为 P 的解 、： 

根据分治法的分割原则，应把原问题分为多少个子问题才较适宜?每个子问题是否规模相 
同或怎样才为适当?这些问题很难 T 以肯定的回答。但人们从大量实践中发现，在用分治法设 
计算法时，最好使子问题的规模大致相同。即将一个问题分成大小相等的 A 个子问题的处理方 
法是行之有效的。许多问题可以取 A =厶这种使子问题规模大致相等的做法是出自一种平衡 
( balandng ) 子问题的思想，它几乎总是比子问题规模不等的做法要好。 

从分治法的一般设计模式町以看出，用它设计出的程序一般是••-个递归算法。因此，分治 
法的计算效率通常可以用递归方程来进行分析。若-个分治法将规模为《的问题分成4个规 
模为 n / m 的子问题。为方便起见，设分解阈值 nO = 1，且 Adhoe 解规模为1的问题耗费〗个单 
位时间，再设将原问题分解为 A 个子问题以及用 Merge * A 个子问题的解合并为原问题的解 
需用 /( n ) 个单位时问:用 T ( n ) 表小该 分治法 Divide ^and - Canquer ( P ) 解规模为 I F * 丨=的 
问题所需的计算时问，则 有： 

i kT ( n / m ) f ( n ) n > 1 

下面讨论如何解这个与分治法有密切关系的递 iU 方程。通常 吋 以用展幵递归式的方法来 
解这类递归方稈，反复代人求解得 

T(n) - + ^ k , f(n/m J ) 

;=° 

注意，递归方程及其解只给出^等于 m 的方幂时 r («) 的值，但足如果认为八幻足够平 
滑，那么由 n 等于 m 的方幂时 TXa ) 的值可以估计 ru ) 的增长速度。通常，我们可以假定 
ru ) 是单调上升的。 
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另一个需发注意的问题是:在分析分治法的 H 算效 率时•通常得到的足递 叫不等式: 


ru) < f 0 ⑴ 71 = 〜 

〜 ^ kT(n/rn) +/(/?) n > n () 

而我们关心的一般是最坏情况卜 _ 的计算时间复杂度的上界，所以用等 §( = ) 还是用小干 
或等于号（矣）足没冇本质区别的。 

以卜 - 讨论的是分治法的基本思想和一般原则。下向我们用一些具体例子来说明如何针对 
具体问题用分治思想来设计有效算法。 

2.3 二分搜索技术 

二分搜索算法是运用分治策略的典型例子。 

给定已排好序的 n 个元索 a[Oj - 1] ，现要在这 u 个儿素中找 (II - 特定元素〜 

首先较容易想到的是用顺序搜索方法，逐个比较 a[0:« - 1] 中元素，直至找出元素 ; t 或搜 
索遍整个数组后确定 x 不在其中 。 这个方法没有很好地利用〃个元素已排好序这个条件，因此 
在最坏情况下，顺序搜索方法需要 0( 幻次 比较。 

二分搜索方法充分利用了元素间的次庁关系，采用分治策略，可在最坏情况下用 O(log^) 
时间完成搜索任务 。 

二分搜索算法的基本思想是将个元索分成个数大致相同的两半，取 a[ n/2] 与 X 作比 
较。如果 2 = a[n/ 2 ] ， 则找到 z ， 算法终止。如罘 X < a[ n/2] ，则我们只要在数组 a 的左半部继 

续搜索 h 如果％ > a[ a/2], 则我们只要在数组 & 的 4 半部继续搜索 X 。 只体 算法可描述 如下： 

• • ' . - • • * v • • ^ ••、.、•、 . . . 

template < class Type > 

int Binary Search ( Type a[ ] , const Type& x, int n) 

!// 在 a[0」< =a|_ 1J < = •… < =a[n - 1 」屮搜索 x 
// 找到 x 时返回其在数组中的位置，否则返回 -1 

int left = 0; int = n — 1; 

while (left < = righl) i 
int middle = (left + right)/2; 
if (x = = a I" middle]) return middle ； 
if (x > af middle]) lefl - middle + 1; 
else right = middle - 1; 

I 

return - J; // 未找到 x 

I 

• • • • 

• _ 

容 M 看出，每执行一次算法的 while 循环，待搜索数组的大小减少一半。因此，在最坏情况 
下， while 循环被执行了 Gduga) 次 / 循环体内运算需要 0(1) 时间，因此整个算法在最坏情况 
下的计算时间复杂性为 

二分搜索算法的思想易于理解，但是要写一个正确的二分搜索算法也不是一件简单的事。 

Kmith 在他的著作 “ The Art of Computer Programming ； Sorting and Searching^ 中提到，第 一 个 

二分搜索算法早在 19 46 年就出现了，但是第 * 个完全 TH 确的二分搜索算法却直到 1962 年才 
出现。 Bentley 也在他的著作 “Writing Correct Programs” 小写道 T 90% 的计算机专家不能在 2 小 
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时内出完仝正确的_：分搜 索算法 : 

2.4 大整数的乘法 


通常，在分析一个算法的计算复杂性时,都将加法和乘法运算，作是基本运算来处理，即 
将执行一次加法或乘法运算所崙的计算时 N 当作一个仅取决于计算机硬件处理速度的常数。 
这个假定仅在参加运算的整数能在计算机硬件对整数的尜示范围内 ik ： 接处理时才是合理的。 
然而,在某些情况下，我们要处理很大的整数，它无法在计算机硬件能直接表示的整数范围内 
进行处理。若用浮点数来表示它,则只能近似地 表不它 的大小，计算结果中的有效数字也受到 
限制。若要精确地表示大整数并在计算结果中要求精确地得到所有位数上的数字，就必须用软 
件的方法来实现大整数的算术运算。 

设/和 y 都是/ I 位的二进制整数，现在要计算它们的乘积 at 。 我们可以用小学所学的// 
法 来设汁 一个汁算乘积的算法，何是这样做计算步骤太多，显得效率较低。如果将每两个 
一位数的乘法或加法 肴作- 步运算，那么这种方法要进行 ou 2 ) 步运算才能求出乘积 
向我们用分治法来设计一个更有效的大整数乘积算法。 

我们将《位的二进制整数 a ' 和 y 都分为 2 段，每段的长为 a / 2 位(为简单起见，假设《是 
2的幂），如图2 3所示。 


位 n /2 位 位 m /2 位 



图 2-3 大整数丨和 r 的分段 

由此 ， J = A 2 n/2 + y = C 2 n/1 + 这样，1和 y 的乘积为： 

XY = (.42 rt/2 + B )( C 2 n/2 + D ) = AC 2 n + (AD + BC ) 2 n/1 + BD 

如果按此式计算 A ： F ，则我们必须进行4次 u /2位整数的乘法 （ 4 C , 4〗) ， 方(：和 ) ， 以及 
3次不超过2〃 位的整数加法(分別对应于式中的加号），此外还要做2次移位(分别对应于式中 
乘和乘2〃 2 )。所有这些加法和移位共用步运算^设 Hn ) 是2个，^位整数相乘所需 
的运算总数，则我们有： 

n ») = | 0(1) " = 1 

UT ( n / 2 ) + 0(n) n > 1 

由此可得 Tin ) = 0( 因此，直接用此式来计算 I 和 F 的乘积并不比小学牛的方法 

更有效：:要想改进算法的计算复杂性，必须减少乘法次数 。 下面我们把写成另一种 形式： 

XY = AC 2 n + ((A - R){D - C ) 十 4 C + BD ) 2 n/2 + BD 
此式看起来似 f 更复杂些，但它仅需做 3 次 n /2 位整数的乘法 （ 4 C，BD 和 U - B){D - 
C )) 次加、减法和2次移位。由此 可得： 


Tin ) 



0 ( 1 ) 

3 T ( n /2) + 0( n ) 



容易求得其解为 T ( n ) : 0( n 1 ^) = OU 159 )。 这是一个较大的改进 i 
上述二进制大整数乘法同样可应用于十进制大整数的乘法以减少乘法次数，提高算法效 
率。如果将一个大整数分成3段或4段做乘法，计算复杂性会发生什么殳化呢?足否优于分成2 
段来做乘法?读者可以通过有关练习得到明确的结论。 
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2.5 Strassen 矩阵乘法 


矩阵乘法是线性代数中最常见的 M 题之一，它在数值计算中有广泛的应用。设 4 和 忍是两 
^ nxn 矩阵，它们的乘积 M 同样是一个/ * X »矩阵 和忍 的乘积矩阵 C 中元素 q 定义为 


若依此定义来计算 4 和 B 的乘积矩阵 C ， 则每计算 C 的一个 元素％ ，需要做 n 次乘法和 

^- 1 次加法。因此，求出矩阵 C 的 〆 个元素所需的计算时间为 0 ( n 3 )。 

20 世纪 60 年代末期， Strain 釆用了类似于我们在大整数乘法中用过的分治技术，将计算 
2 个《阶矩阵乘积所需的计算时间改进到 0 (〃〜 7 ) = 0 ( a 281 )。 其基本思想还是使用分治法。 

首先，我们仍假设 n 是 2 的幂。将矩阵 A , 5 和 C 中每一矩阵都分块成为 4 个大小相等的 
子矩阵，每个子矩阵都是 zi /2 x n / 2 的方阵。由此可将方程 C ^ AB 重写为 


由此吋得 


C n 

Cn 


^ n 

^12 

忍 M B 12 

[c 21 

cj 


■ A 2 | 

^22^ 

^21 S 22 


C]i = + ^12-^21 

^12 - ^11^12 + ^ 12^22 
[21 = ^ 21^11 + ^ 22^21 


^22 = ^21^12 + ^22^22 


如果 n = 2 ,则 2 个 2 阶方阵的乘积可以直接计算出来，共需 8 次乘法和 4 次加法。当子矩 
阵的阶大于 2 时，为求 2 个子矩阵的积，可以继续将子矩阵分块，直到子矩阵的阶降为 2 。这样， 
就产生了一个分治降阶的递归算法。依此算法，计算 2 个 u 阶方阵的乘积转化为计算 8 个 n/2 
阶方阵的乘积和 4 个《/ 2 阶方阵的加法。 2 个 ti /2 x zi / 2 矩阵的加法显然可以在 OU 2 ) 时间 
内完成。因此，上述分治法的计算时间耗费 T { n ) 应 满足： 


f 0(1) n = 2 

U 一 Ur ( n / 2 ) + 0 ( n 2 ) n > 2 

这个递归方程的解仍然是 T ( n ) = 0U 3 )。 因此，该方法并不比用原始定义直接计算更有 
效。究其原因，是由于该方法并没有减少矩阵的乘法次数。而矩阵乘法耗费的时间要比矩阵加 
(减）法耗费的时间多得多。要想改进矩阵乘法的计算时间复杂性，必须减少乘法运算。 

按照上述分治法的思想可以看出，要想减少乘法运算次数,关键在于计算 2 个 2 阶方阵的 
乘积时，所用乘法次数能否少于 8 次。 Suassen 提出了一种新的算法来计算 2 个 2 阶方阵的乘 
积。他的算法只用了 7 次乘法运算，但增加了加、减法的运算次数。这 7 次乘 法是： 

A/】 = An (^12 - ^ 12 ) 

M 2 = ( A " + ^ 32)^22 
^3 = (^21 + ^ 22)^11 
A/4 = A ! 2 ( 及 2 】一及 Jl ) 

Mf, - (An + 4 22 )( 及】彳 + 及 22 ) 
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^6 - }2 ^ 22 ) ( ^2 J 忍 22 ) 

Mj ^ (A 11 — Aj 】）（ ^i]+ B]^) 

做了这7次乘法后，冉做若干次加、减法就可以得到： 


C" u = 


h M a - 

- A/ 9 -f 

严 

M 6 

Cn = 

H 

h M, 



^21 = 

M 3 h 

h m 4 



C 22 = 

M 5 h 

h Mj - 

■ A / 3 — 

M 1 


以 hi 卜算的正确性很容易验证。 

Slra^en 矩阵乘积分治算法屮，用了 7次对于 n/2 阶矩阵乘积的递归调用和18次《/2阶 
矩阵的加减运算。由此可知，该算法的所需的计算时间 T ( n ) 满足如下的递! I I 方稈： 

… ro(l) n = 2 

T { n )=] ， 

\ lT ( n / 2 ) + 0 { n 2 ) n > 2 

解此递 !H 方程得 T ( n ) = 0 { n ^ 7 ) « 0U 2 8i ) 。由此可见， Strain 矩阵乘法的计算时间 
复杂性比普通矩阵乘法有较大改进。 

有人曾列举/计算2个 2x2 阶矩阵乘法的36种不同方法。但所有的方法都至少做7次乘 
法。除非能找到一种计算2阶方阵乘积的算法，使乘法的计算次数少于7次.计算矩阵乘积的 
沖算时间下界才有可能低 T OU 281 )。 但是 Hopcroft 和 K^r 己经证明097】），计算2个2 x 2 
矩阵的乘积,7次乘法是必要的。因此，要想进一步改进矩阵乘法的时间复杂性，就不能电基 f 
计算 2x 2 矩阵的7次乘法这样的方法或许应当研究3 x 3或5 x 5矩阵的 E 好算法 。在 
Strain 之后又有许多算法改进了矩阵乘法的计算时间复杂性， H 前最好的 U 算时间 i: 界是 
0 ( n 2 ^) o 而目前所知道的矩阵乘法的最好下界仍是它的平凡下界以〃 2 )。因此到目前为止 
还无法确切知道矩阵乘法的时间复杂性。关于这一研究课题还有许多丁作 可做。 

2.6 棋盘覆盖 

在一个 x 个方格组成的棋盘中，荇恰有一个方格与其他方格不同.则称该方格为- 
特殊方格， a 称该棋盘为一特殊的棋盘。显然特殊方格在棋盘 
上出现的位置有 4 fe 种情形。闪而对任何 A； >0,有 V种不同的 
特殊棋盘。图 2-4 中的特殊棋盘是当 A = 2时16个特殊棋盘屮 
的 一 个、， 

在棋盘覆盖问题中，我们要用阁 2-5 所示的4种不同形态 
的 L 型骨牌覆盖 - 个给定的特殊棋盘上除特殊方格以外的所 
冇方格，且任何2个 L 型骨牌不得重叠覆盖。鉍知，在任何一个图 2 4 〃 = 2 时的个特殊棋盘 

2 k x 2 k 的棋盘覆盖中，用到的 L 型骨牌个数恰为(4 4 - 1)/3, 

用分治策略，我们可以设计出解棋盘覆盖问题的 - 个简捷的算法 
^ k > 0时，我们将 2 a x 2 a 棋盘分割为4个 V- 1 子棋盘如图 2-6U) 所示 t 

特殊方格必位于4个较小子棋盘之〜中，其余3个子棋盘中无特殊方格。为『将这3个尤 
特殊方格的子棋盘转化为特殊棋盘，我们可以用一个 L 型骨牌覆盖这3个较小棋盘的会合处， 
如图 2-6(b) 所示，这3个子棋盘 h 被 L 沏骨牌覆盖的方格就成为该棋盘上的特殊方格，从而将 

■ 17 • 






<a) (b) (c) (d) 

图 2-5 4 种不间形态的 L 型骨牌 



2 卜 ]X2 卜 1 

2 4 ‘ , X2 卜 1 




( a ) 


(b> 


图 2-6 棋盘分割 

原问题转化为4个较小规模的棋盘覆盖问题。递 IU 地使用这种分割，肓至棋盘简化为1 x 1 
棋盘。 

实现这种分治策略的算法 ChessBoard 可实现 如下： 

sms • • • • • 、 • • • • • • • • 馨參 ■讎 ％ ■參 ■參 雜 

void ChessBoard(int tr, ini tc，int dr, int dc, int size) 

I 

if (size = = 1) return; 
int t - tile + + , // L 型骨牌号 
s - size/2; // 分割棋 & 

//覆盖左上角子棋盘 

if (dr < tr + s & & dc < Ic + s) 

// 特殊方格在此棋盘屮 

ChessBoard(tr, tc, dr, dc ， s); 

else }// 此棋盘屮无特殊方格 

// 用 t 号 L 型骨牌覆盖右下角 

Board[ tr + s - 1 J L to + s - 1 ] - t; 

// 覆盖其余方格 

ChessB<>ard(tr, tc» tr + s - 1, lc* + « - 1 1 s); i 

// 覆盖右上角了 •棋盘 

if (iir < tr + 5 ? & & dv > = k、+ 务） 

// 特殊方格在此棋盘中 

ChessBuard( tr, tc + s ， dr, dc, a ); 

else I // 此棋盘中无特殊方格 

// 用 t 号 L 型骨牌覆盖左下角 
BoardL tr + 8 - 1 J. Jo + sj = 1; 
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// 覆盖其余方格 

C h ess Board (tr, tc + s t tr + s - K Ic + s ， s);: 


// 覆盖左]"角子棋盘 

if (dr > = tr + s & & dc < Lc + s) 

// 特殊方格在此棋盘中 

ChessBoardf tr + s, tc, dr^ (ic ， s); 

else j// 用 t 号 L 型骨牌覆盖心上角 
BoardLtr + s] [ tc + s - I. = t; 

// 覆盖其余方格 

ChessBoard(tr + s, tr^ tr + U; + s — 1 ， s) i \ 


// 覆盖右下角+棋盘 

if (dr > = tr + s & & dr > = tc + s) 

// 特殊方格在此棋盘中 

ChessBoard(tr + .s, tc + dr ， dc, s); 

else 、 // 用 t 号 L 型骨牌覆盖左上角 

Board tr + s] Ltc + s] = t; 

// 覆盖其余方格 

ChessBoard(tr + s, to + s, tr + s，tc + s, s); 

! 

I 

•* • r • ■ r • ar * ••• • • • • _ _ 

上述算法中，用一个二维整型数组 Board 表示棋盘。 Board[0][0] 是棋盘的左上角方格。伽 
是算法中的一个全局整型变量，用来表示 L 型骨牌的编号，其初始值为0。算法的输人参 数是： 
tr： 棋盘左1：角方格的 行号； 
tc： 棋盘左上角方格的 列号； 
dr： 持殊方格所在的 行号； 
dc： 特殊方格所在的 列号； 
size:size = 2\棋盘规格为 x 2、 

设 TU) 是算法 ChessBcmrd 覆盖一个妒><24棋盘所需的时间，则从算法的分治策略可知， 
ru) 满足如下递归 方程： 


m ) 


0 ( 1 ) k = Q 

4 ru - 】）+ 0 ( 1 ) k . > () 


解此递归方程可得 T ( k ) = 0(4 A )。 由于覆盖一个V X 棋盘所需的 L 型骨牌个数为 

(4^ 1)/3,故算法 Che SS B 0ar d 是一个在渐近意义下最优的算法。 


2.7 合并排序 

合并排序算法是用分治策略实现对〃个元素进行排序的算法。其基本思 想是： 当《 =】时 
终止排序，否则将待排序元素分成人小大致相同的两个子集合，分别对两个子集合进行排序, 

最终将排好序的子集合合并成为所要求的排好序的集合。合并排序算法可递 P 地描述 如下： 

• • • • • • 

template < class Typ« > 

void MergeSort( Type a[], int l^ft, int right) 
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if (Idl < ritrht) V/ 罕 • 少有 2 个兀素 
int i = (left + riglit)/2; // 取中点 
MergeSort(a, left, i )； 

MergeSort(a, i + J ， right); 

Merge(a, b, left ， i, right )； // 合并到数组 b 
Copy(a, b. left, right )； //M 制回数组 a 


其中，算法 Merge 合并两个排好序的数组段到一个新的数組1^中，然后由 Co py 将合并后的数组 
段再复制冋数组 a 屮。 Merge 和 Copy 显然可在 0 U ) 时间内完成，因此合并排序算法对 n 个元 
素进行排序，在最坏情况下所需的计算时间 T ( n ) 满足 


Tin ) 


「 0 ( 1 ) n 备 I 

I2 T ( n /2) + 0( n ) n > 1 


解此递 ! U 方程吋知 r ( n ) : oUbg ^)。 由于排序问题的计算时间下界为 ouiog «)， 故 
合并排序算法足一个渐近最优算法 


对于算法 MergeSort , 还可以从 多力面 对它进行改进。例如，从分治策略的机制人于，容易 
消除算法中的递归•，事实卜_，算法 McrgeSort 的递归过程只足将待排序集合一分为二，直至待 
排序集合只剩下一个元素为止，然后不断合并网个排好序的数组段。按此机制，我们可以首先 
将数组 a 中相邻元素两两配对 。用合 并算法将它们排序，构成〃/2组长度为2的排好序的子数 
组段，然后再将它们排序成长度为4的排好序的了数 组段， 如此继续下去，直至整个数组排 
好序。 

按此思想，消 上递! U 后的合并排序算法可描述 如下： 


template < class Type > 

void MergeSort( Type a.」, int n) 

1 

、 

Type 冬 b = new Type [ ; 



while (s < n) i 

MergePa&s(a, b ， s ， n); // 合并到数组 h 


MergePassCb, a, s t a )； // 合并到数组 a 


其中，函数 Me 妒 P 脱用于合并排好序的相邻数组段。貝体的合并算法由 Merge 来实现。其中要 
注意定义关于类型为 Type 的元素的比较运算“ < =”。特別地，如果 T yp e 是自定义的，则必须 
重载运算“< =”。 

template < class Type > 

void MergePass( Type xU ， Type ], ini s T int n) 

)// 合并人小为/的相邻子数至 fT 

int i ^ 0; 
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whU<? (i < = n - 2 * s) I 

// 合并大小为 s 的相邻 2 K 子数组 

Merge(x, y ， i，i + s « 1, i + 2 * s - 1); 
i = i + 2 、 s; 


// 剩 卜的 元索个数少于 2s 

if (i + s < n) Merge( x ， y, i ， i + s _ 1 ， n ■ 1 ) ; 
else for (int j= ： i;j<=n-l;j + + ) 

yLj] = x[jj ； 


template < class Tvjie > 

void Merge(Typ<f cf ] t Ty|^ d[ 1 , int l T int m t int r) 
\// 合并 c[l ： jnJ 和 c[m + 1 :r ] 到 d[l:r 」 



while ((i < = m ) & & (j < = r )) 

if (c[i] < - cLjJ) d[k + + ] = c[i+ + ]; 

eke d [ k + + ] ^ c [ j + + ^ ; 
if (i > m) for (int q =： j ; q < = r; q + + ) 

d[k 十十」 二 cLq ]； 

else for (int q = i;q<=m;q+ + ) 

d[k 十 + ] = c[qj; 

I 

§ 

I 

^ • * • • • • 

自然合并排序是上述合并排序算法 MergeSort 的一个变形。在上述合并排序算法中，我们 
在第一步合并相邻长度为]的子数组段，这是因为长度为I的子数组段是 Q 排好序的。事实 
t， 对于初始给定的数组通常存在多个 fe 度大于1的已 S 然排好序的？数组段。例如，若数 
组 a 中元素为|4,8,3,7，1，5,6,2丨，则自然排好序的子数组段有14,81，！3,7:,;1，5,6丨和 j2:、、 
用 i 次对数组^的线性扫描就足以找出所有这些排好序的子数组段。然后将相邻的排好序的 T 
数组段两两合并，构成更大的排好序的子数组段。对上面的例子，纶〜次合并后我们得到2个 
合并后的子数组段 i 3,4,7,8! 和 jl，2,5,6L 继续合并相邻排好序的子数组段，直至整个数组 
已排好序。上面这2个数組段疼合并后就得到 U ， 2 ， 3，4 ， 5，6 ， 7 . 8: 。 

匕述思想就是自然合并排序算法的基本思想 。在通 常情况 F . 按此力式进行合并排序所需 
的合并次数较少。例如，对 f 所给的 n 元素数组已排好序的极端情况，自然合并排序算法不需 
要执行合并步，而算法 MergeSort 耑要执行 「 log 糾次合并。因此，在这种情况下，自然合片排字 
算法需要 0(/1) 时间，而算法 MergeSort 需要 0(7? log a ) 时间 ： 


2.8 快速排序 

快速排序算法是基于分治策略的另一个排序算法 o 其基本思想是，对于输人的子数组 
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a [ p : r ]. 按以下五个步骤进行 排序： 

( 1 ) 分解 ( Divide ) :以 a [ p ] 为基准元素将 r ] 划分成3段 3 l [ p ; q - l ]， a [ g ] 和 a [ g + 
l : r ], 使得 a[ p: y - 1] 屮任何一个元素小于等于 a[g Lab + l : rj 中任何 • 个元素大于等于 
a [«7] :下标 g 在划分过程中确定。 

(2) 递归求解 （ Conquer ) :通过递 M 调用快速排序算法分別对 a [ p :彳 - 1」和 a [ </+丨： r ] 进 
行排序。 

(3) 合并 （ Merge ) :由于对 - 1] 和 aLy + 1: r ] 的排序是就地进行的，所以在 a [ : 
g - 1] 和 a[y + hr ] 都已排好的序后不需要执行任何计算 afyr ] 就已排好序。 

基于这个思想，可实现快速排序算法 如下： 

___/■■ j • • • r • • • •• • • 

template < clash Type > 

void QuickSort (Type a[ ], ini p, ini r) 

if (p < r) 1 

int q Partition(a» p. r) j 

QuickSorl (a,p,q - l)i // 对左半段排序 

QuickSort (a,q + I ,r); // 对十，段排序 


对含有 u 个元素的数组 a [0:« - 1] 进行快速排序只嬰调用 QuickSorl ( a ,0^- l ) 即可。 
上述算法中的函数 Partition , 以、，个确定的基准元素 a : p ] 对子数组 a[p : r ] 进行划分.它 
是快速排序算法的关键。 

_，，參 ■■攀 讎 ■參 參 _馨04 _ _■ 籲 春髒_ flV _ 參 鲁 參 

templale < class Type > 

int Partition (Type a[j ， int p, int r) 

int i = p> 
j = r + 1 ； 

Type y = a[p^; 

// 将 < X 的元素交换到左边区域 
// 将 > X 的元素交换到右边区域 

while (true) i 

while (a|_ + + i] < x); 
while (a[ — j] > x); 
if (i > = j) break; 

SwapU[i: ， aLj ])； 

) 

a[p] - a.jj; 
a[j] = x; 

return j; 

j 

• • • • _ • _ • 

Parthkm 对 a [ P : r ] 进行划分时，以元尜 ； t 作为划分的棊准，分别从左、右两端开 

始,扩展两个区域 a [ ^ : i ] 和《 [ y : r ] ， 使得 a [ : ] 中元素小于或等尸 x ^^ j ^ r ] 中元素大于 
或等于初 始时“ = />， 且 j = r + 1 ：, 

在 while 循环体中，下标 y 逐渐减小，（逐渐增大，直到 aN ] ^ ^ a [ y ]。 如果这两个不等 
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式是严格的，则 a [ i ] 不会是左边区域的元素，而 <>] 不会是 4 边 IX 域的元此时若 f < jM 
应该交换 a [ i ]- tja [ y ] 的位置，扩展左右两个区域。 

while 循环重复至 i 多 J 时结束 。这时 a [ p : r ] d 被划分成 a [ p:q - 1 ]， a [ ry :和 a [ q +丨： rj , 
且满足 abi - 1] 中元素不大于 a[y + l ： r ] 中元素。在 Partitiim 结束时返回划分点 g = y 3 
事实 h ， 函数 Partition 的主要功能就是将小于工的元素放在原数组的左 f 部分。而将大于 
^的元素放在原数组的右半部分。其中，有一些细节需要注意。例如，算法中的下标〖和 ； 不会 
超出 a [ p ： r ] 的下标界。另外，在快速排序算法中选取 a [ p ] 作为基准可以保证算法正常结束。 
如果选择 a [ r ] 作为划分的基准，且 a [ r ] 又是 a [ p ： r ] 中的最大元素，则 Parlitbn 返回的值为 
q - r , 这就会使 Quicksort 陷人死循环。 

对于输入序列 a [ p :「] ， Partitiun 的计算时间显然为 0( r - p - l) rj 
快速排序的运行时间与划分是否对称有关，其最坏情况发生在划分过程产牛的两 个区域 
分别包含 n - 1个元素和1个元素的时候。由于函数 Partition 的计算时间为 0 U )， 所以如果算 
法 Partition 的每一步都出现这种不对称划分，则其计算时间复杂性 T ( n ) 满足 

n ，) = { a(1) 

- 1) + 0( n ) « > 1 

解此递归方程可得 Tin ) . 0( n 2 )o 

在最好情况下，每次划分所取的基准都恰好为中值，即每次划分都产生两个大小为 zi /2 的 
区域，此时, PanUkm 的计箅时间： TU ) 满足 


T ( n ) = { 


0 ( 1 ) 

2 T ( n /2) + 0( n ) 



其解为 T ( n ) = 0( nlog ^) 0 

可以证明，快速排序算法在平均情况下的时间复杂性也是0 U loga ) ， 这在基于比较的排 
序算法类中算是快速的，快速排序也因此而得名。 

我们已看到，快速排序算法的性能取决于划分的对称性。通过修改函数 Partition , 可以设 
计出采用随机选择策略的快速排序算法。在快速排序算法的每一步中，当数组还没有被划分 
时，可以在 a [ p : r ] 中随机选出一个元素作为划分基准，这样可以使划分基准的选择是随机的, 
从而可以期望划分是较对称的。随机化的划分算法可实现如下： 

• J • • • ■ ^ ••••••• - - •着 • •- ,• 、 a • 一 •钂 • w ki.ij “ • % * 

template < class Type > 

int RandomizedPartition (Type a[ ] , int p，int r) 

int i - Random(p,r); 

Swap(a[ij, a[p]); 
return Partition (a ， p ， r); 


其中，函数 Random ( 产生 p 和 r 之间的一个随机整数， JSl 产生不同整数的概率相同。随机 
化的快速排序算法通过调用 RandomizedPartition 来产生随机的划分。 

• ••• S m S Jlkl.JI ••• • • ^ tr • • • • • • • 产 • • • •• •• • • • • • •■•••• • J s 

template < class Type > 

void RandomizedQuickSort (Type a[ ], int p，int r) 


if (p < r) I 
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int q = RandomizedPartitioiUa, p t r); 
KandomizcdQiiitrkSurt (a, p»q — 0 * // 对左半段排序 
Rand umi zed Quick Sort (»iq + // 对右半段排厂予 


2.9 线性时间选择 

在这一节中，我们要讨论与排序 f"j 题类似的元素选择问题。儿素选择问题的一般提 法是： 
给定线性序集中 n 个元素和一个整数11 ^ k ^ n 费求找出这》个元素中第 A 小的元素，即 
如果将这 a 个元素依其线性序排列时,排在第^个位置的元素即为我们要找的元素。当& = 1 
时，就是要找最小元素;当 A = a 吋，就娃要找最大 兀素； 当 k = (n + 1)/2 时，称为找中位数。 

在某些特殊情况下，很容易设计出解选择问题的线性时间算法。例如，找《个元素的最小 
元素和最大元素显然可以在 0 U ) 时间完成。如 果&备 n / logn ， 通过堆排序算法可以在 
0 ( n 十 / Hog / i ) = 0 ( n ) 时间内找出第 M 、 元素。当 k ^ n - uAo ^ n 时也一 样。 

一般的选择问题，特别是中位数的选择问题似乎比找最小元素要难。但事实上，从渐近阶 
的意义上看，它们足一样的。一般的选择问题也可以在 0 { n ) 时间内得到解决。下面我们讨论 
解一般选择问题的一个分治算法 RandomizedSel^t 滅算法 实际上是模仿快速排序算法设计出 
来的。其基本思想也是对输入数组进行递归划分。与快速排序算法不同的是，它只对划分出的 
子数组之一进行递归处理。 

算法 RandomizedSelect 用到我们在随机快速排序算法中讨论过的随机划分函数 
RandomizedPartition。 因此,划分是随机地产生的。由此导致算法 Randomized Select 也是一个随 
机化的算法。要找数组《[0:71 - 1] 中第&小元素只要调用 RandomizedSelect(a ,0, n _ 1， /c) 即 

可。具体算法可描述 如下： 

.. ■ ■ ■ ■ ■ . . . . ■■丨 ■, 〆〆 ■-■■■ . 

template < class Type > 

Type ftandomizedSelwU Type aL 」 ，i【iL f，int k) 

I 

1 

if (p = = r) return al_p」； 
int i r： RandomizedPartition(a,p, t ), 
j = i - p + 1» 

if (k < = j) return RandoinizedSelect(a ? p,i, k)； 
else return Kari(lornizedSelect(aJ + 1，r，k ■ j); 

! . . 

• • / I // / / m ^ w ^ • • 

在算法 Randomized Select 中执行 Rando m i zed Far t i t i o n 后，数组 a[p : r ] 被划分成两个子数 
组 aL ) “]和 a [ Z + 1: r ] ， 使得 a ：^.] 中每个元素都不大于 a [^ l ： r ] 中每个元素 。 接着算法 
计算子数组 a [ p :〖] 中元素个数如 果&矣 J ， 则 a [ p ： r ] 中第 t 小元素落在子数组 a [ p d ] 中。 
如果 A > y ， 则要找的第 &小元 素落在子数组 a [ i + l ： r ] 屮。由于此时已知道子数组中 
元素均小于要找的第左小元素，因此，要找的心/>: "] 中第小元素是 a [/ + l : r ] 中的第 A - y 

小元素。、 • _ 

容易看出，在最坏情况下，算法 RandomizedSek^ 需赀 H( m 2 ) 汁算时间。例如在找最小元 

素时，总是在最大元素处划分。尽管如此，该算法的 f 均性能很好。 
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[tl T 随机划分函数 RandomizedParlition(€ffl f ~ * 个随机数产少器 Random . 它能随机地产 
生 p 和「之问的一个随机整数，因此， RandomizeilPartition 产生的划分基准是随机的。在这个条 
件下，可以证明，算法 Randomized Select 可以在 <9 ( n ) 均时间内找出^个输人元素中的第 /c 
小元素。 

下面来讨论-个类似于 KambmizedSeKalH 可以在最坏情况下用 0 ( n ) 时间就完成选择 


任务的算法 Select 。 如果我们能在线性时间内找到一个划分基准，使得按这个基准所划分出的 
两个子数组的长度都至少为原数组长度的 s 倍 (0 < e < 1是某个正常数），那么在最坏情况下 
用0(«)时间就可以完成选择任务:例如，若 e = 9/10,算法递归调用所产生的子数组的长度 
至少缩短1/10。所以，在最坏情况下，算法所需的计算时间 ？’（〃） 满足递归式 T ( n ) ^ 
T ( 9 n /\ 0 ) + 0 U )。 由此可得 T ( n ) ^ 0 ( n ) 0 


我们可以按以下步骤来寻找一个好的划分 基准： 

( 1 ) 将《个输人元素划分成「〃 个组，每组5 
个元素，除可能有一个组不是5个元素外。用任意 
一种排序算法，将每组中的元素排好序，并取出每 
组的中位数，共「《/51个。 

(2) 递归调用 Select 来找出这「 n /5 l 个元素的 
中位数。如果 「 n /5 l 是偶数，就找它的两个中位数 
中较大的一个。然后以这个元素作为划分基准。 

图2 -7 是上述划分策略的示意图，其中《个元 
素用小圆点来表示，空 心小圆 点为每组元素的中位 

数。中位数的中位数 x 在图中标出。图中所画箭头是由较大元素指向较小元素。 

只要等于基准的元素不太多，利用这个基准来划分的两个子数组的大小就不会相差太远。 
为了简化问题，我们先设所有元素互不相同。在这种情况下，找出的基准 X 至少比 3 Un - 
5)/10」个元素大，因为在每一组中有两个元素小于本组的中位数，而 L «/5 J 个中位数中又 
有 LU -5)/10」个小于基准 h 同理,基准％也至少比 3 LU -5)/10」个元素小。而当 n ^ l 5 
时， - 5)/10.| ^ zx /4。 所以按此基准划分所得的两个子数组的长度都至少缩短1/4。 这- 
点是至关電要的 。据此 ，我们给出算法 Select 如下： 



template < class Type > 

Type Seleet( Type a[ J ， int p t int r. int k) 


if (r - P < 75) j 

用某个简单排序算法对数组 a L p:r ] 排序； 

return p + k - 1 ] ; 

I ； 

for ( int i = 0; i < = (r - p - 4)/5 ; i + + ) 

将 a[p + 5 * ij 至 a[p + 5 i + 4] 的第 3 小元素 
与 a[ P + i] 交换 位置； 

// 找中位数的中位数, r- p-4 即上面 所说的 n - 5 
Type x = Select(a, p«* p + (r - p - 4)/5, (r - p - 4)/10) : 
int i ；= PartitionCa.p, r, x), 
j = i - p + 1; 
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if (k < - j) return Select!a^ p ， i ， k); 
else return Select(a，i + 1 山 k ■ j); 


为了分析算法 Select 的计算时间复杂性，设 ri =， - P + 1，即 n 为输入数组的长度。算法 
的递归调用只有在 /I > 75时才执行。因此，当 n <15 时算法 Select 所用的计算时间不超过一 
个常数 q 。找到中位数的中位数 a 后，算法 Select 以 x 为划分基准调用函数 Partition 对数组 
a [ p ： r ] 进行划分，这需要 0 U ) 时间◦算法 Select 的 for 循环体行共执行 n /5 次，每一次需要 
0(1) 时间。因此，执行 for 循环共需 0( n ) 时间。 

设对 n 个元素的数组调用 Select 需要 Tin ) 时间，那么找中位数的中位数$至多用了 
T ( n /5) 的时间。我们已经证明了，按照算法所选的基准 x 进行划分所得到的两个子数组分别 
至多有 3/1/4 个元素。所以无论对哪一个子数组调用 Select 都至多用了 T (3 n /4) 的时间。 

由此，我们得到关于 T ( n ) 的递归式 




Ci 

C 2 n + T(n/5) + T{3n/4) 


n < 15 
n ^ 75 


解此递归式可得 Tin) = 0(n) 0 

由于我们将每一组的大小定为5,并选取75作为是否作递归调用的分界点。这两点保证了 
的递归式中两个自变量之和 n/5 + 3n/4 = 19/ i /20 = cm ，0 < a < 1。这是使 Hn) : 
0( n ) 的关键之处。当然，除了 5和75之外,我们还可以有其他选择。 

在算法 Select 中，我们假设所有元素互不相等，这是为了保证在以为划分基准调用函数 
PartUion 对数组 a [ p ： r ] 进行划分之后，所得到的两个子数组的长度都不超过原数组长度的 
3/4。当元素可能相等时，应在划分之后加一个语句，将所有与基准 x 相等的元素集中在一起， 
如果这样的元素的个数 m 為1，而且 j 矣 k 矣 j + m - 1 时，就不必再递归调用，只要返回 a [ i ] 
即可。否则最后 一 行改为调用 Select (i + m + l ， r ， fc -/- m ) 0 


2.10 最接近点对问题 


在计算机应用中，常用诸如点、圆等简单的几何对象表达现实世界中的实体。在涉及这些 
几何对象的问题中，常需要了解其邻域中其他几何对象的信息。例如，在空中交通控制问题中, 
若将飞机作为空间中移动的一个点来处理，则具有最大碰撞危险的两架飞机，就是这个空间中 
最接近的一对点。这类问题是计算几何学中研究的基本问题之一。下面我们着重考虑平面上的 
最接近点对问题^ 

最接近点对问题的提法是 :给定 平面上〃个点，找其中的一对点，使得在《个点组成的所 
有点对中，该点对间的距离最小。 

严格地说，最接近点对可能多于一对，为简单起见，我们只找其中的一对作为问题的解。这 
个问题似乎很容易解决 c 我们只要将每一点与其他《 - 1个点的距离算出，找出达到最小距离 
的两点即可。然而，这样做效率太低，需要 0( n 2 ) 的计算时间。可以证明，该问题的计算时间下 
界为这个下界引导我们去找问题的一个 d ( nlo ^ n ) 时间算法。很自然地我们会想 
到用分治法来解这个问题。 

将所给的平面上 a 个点的集合 S 分成两个子集心和 S 2 ，每个子集中约有 n /2 个点。然后 
在每个子集中递归地求其最接近的点对。在这里，一个关键的问题是如何实现分治法中的合并 
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步骤，即由^和心的最接近点对，如何求得原集合 S 中的最接近点对。如果组成 S 的最接近 
点对的两个点都在 S, 中或都在心中，则问题很容易解决。但是，如果这两个点分别在 Si* s 2 
中，则问题就复杂些。 

为使问题易于理解和分析，我们先来考虑一维的情形。此时中的《个点退化为; C 轴上的 
n 个实数最接近点对即为这 n 个实数中相差最小的两个实数。昆然可以先将 
…，〜 排好序，然后，用一次线性扫描就可以找出最接近点对。这种方法的主要计算时 

间花在排序上，因此耗时0 ( niogn ) 。然而这种方法无法直接推广到二维的情形。因此，对这种 
一 维的简单情形，我们还是尝试用分治法来求解，并希望推广到二维的情形。 

假设我们用 X 轴上某个点 m 将 S 划分为两个集合心 和心 ，使得& = Ue mi ; 

S 2 = I ^ 5 I ^ > m | 。这样 一 来，对于所有 pG Si 和 S2 有 p 〈兮。 

递归地在 &和心 上找出其最接近点对 lp ,， p 2 l 和并设 

d = mini I pi - />2 I » • - ^2 I ■ 

由此易知， S 中的最接近点对或者是 | pi ， p 2 i , 或者是或者是某个，其 
中，；>3 6 &且 S 2 。如图 2-8 所示。 



图 2-8 —维情形的分治法 

我们注意到，如果 S 的最接近点对是 I p 3 ，^3 1 ，即丨 p 3 ^ ^3 I < d ，则 P 3 和卩3两者与 m 的 
距离不超过 ei ， 即丨 p 3 - m \ < dy I 93 - m 丨 < d 。 也就是说 ，/>3 

m + rf]。 由于每个长度为 c/ 的半闭区间至多包含&中的一个点，并且 m 是心和 心的分割点， 
因此（讲- d , m ] 中至多包含一个 S 中的点。同理， （m，m + d] 中也至多包含一个 S 中的点。 
由图 2-8 可以看出，如果 （w - d , m ] 中有 S 中点，则此点就是&中最大点。同理，如果 

中有 S 中的点，则此点就是5 2 中最小点。因此，我们用线性时间就能找到区间 （m 

中所有点，即 p 3 和价从而我们用线性时间就可以将 S , 的解和 S 2 的 
解合并成为 S 的解。也就是说，按这种分治策略，合并步可在 0 ( n ) 时间内完成。这样是否就可 
以得到一个有效的算法呢?还有一个问题需要认真考虑，即分割点 ra 的选取，及\和 S 2 的划 
分。选取分割点 m 的一个基本要求是由此导出集合 S 的一个线性分割，即 5 = 5 , U S 2 i S ^ 
0 , S2 # 0 ， 且 Si 匚 1 a ； 岑 /« ! » S2 c ! ^ J ^ > 爪丨 。容 易看出，如果选取爪 = 

max( ^^ min ( 5 ) ，可以满足线性分割的要求。选取分割点后，再用 0( n ) 时间即可将 S 划分 

成 *5! = 和 S 2 = ) x S \ x > m 丨。然而，这样选取分割点 m ， 有可能造成 

划分出的子集\和 S 2 的不平衡。例如在最坏情况下，丨 Si I = 1， I S 2 I = - 1 ，由此产生的 

分治法在最坏情况下所需的计算时间 Tin ) 应满足递归方程： 

T(n) = T(n _ 1 ) 十 0(n) 

它的解是 T(n) = 0U 2 )。 这种效率降低的现象可以通过分治法中“平衡子问题”的方法加以 
解决。我们可以适当选择分割点〜使 S , 和心中有个数大致相等的点。自然地,我们会想到用 
S 中各点坐标的中位数来作分割点。 Blum 的选取中位数的线性时间算法使我们可以在 0( n ) 
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时间内确定一个平衡的分割 点 m 

至此，我们设计出一个求一维点集 S 的最接近点对的算法 Cpairi 如卜 


bool Cpairl ( S . d ) 


n = f S I ; 

if (n < 2) { 

(1 = 30 ; 

return false; 

t 

m = S 中各点坐标的中 位数； 

构造 S 1 和 S 2; 

//SI = lx€: Six < = m',S2= ! ,-x ^ Si x > m! 
Cpairl { SI, dl); 

Cpairl(S2,d2); 

p = max (SI )； 
q - min(S2); 
d = min(dl, d2,q - p); 
return true; 


以上分析可知，该算法的分割步骤和合并步骤总共耗时 0 U )。 因此，算法耗费的计算时 
间 ru ) 满足递归方程 


T(n) _ \00) n <4 

n — \2T{n/2) + 0(n) n ^4 
解此递归方程可得 T(n) = OUlog / i )。 

这个算法看上 i 比用排序加扫描的算法复杂，然而它可以推广到以下二维的情形。 

设 S 中的点为平面上的点，它们都有两个坐标值 a 和^为了将平面上点集 S 线性分割为 
大小大致相等的两个子集 Si 和 S 2 ，我们选取一垂直线 l：x = m 来作为分割直线。其中， m 为 
S 中各点％坐标的中位数。由此将 S 分割为\ 彡 ml 和〜 =4631 x (/0 

> mL 从而使 A 和5 2 分别位于直线；的左侧和右侧，且 S =心 U 心、由 于爪是 S 中各点 
^坐标值的中位数，因此^和 s 2 中的点数大致相等。 

递归地在 S , 和&上解最接近点对问题，我们分别得到 Si 和 S 2 中的最小距离4和。现 
设= mit ^ rf ,， 4 L 若 S 的最接近点对(…彳）之间的距离小于 r /， 则/>和9必分属于&和 S 2 。 
不妨设 P e s l7(I e 心。那么和 (/ 距直线/的距离均小于心因此，若我们用&和户 2 分别表 

示直线 Z 的左边和右边的宽为 rf 的两个垂直长条区域，则 P G P | 且 g G 匕,如图 2-9 所示。 

在一维情形下，距分割点距离为 d 的两个 K 间 U - d , m ] 和 U，m +糾中最多各有 S 
中一个点。因而这两点成为惟一的未检查过的最接近点对候选者。二维的情形则要复杂些，此 
时，户，中所有 点与匕 中所有点构成的点对均为最接近点对的候选者。在最坏情况下有 n 2 /4 

对这样的候选者。但是和圪中的点具有以下的稀疏性质，它使我们不必检査所有这 n 2 /4 
个候选者。考虑 A 屮任意一点 P ，它若与 P 2 中的点<?构成最接近点对的候选者，则必有 
distance (^^) < L 满足这个条件的 P 2 中的点有多少个呢?容易看出这样的点一定落在一个 
d x 2 d 的矩形 A 中，如图 2 M 0 所示。 
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图 2-9 距直线 Z 的距离小于 d 的听有点 图 2-10 包含点 q 的 d x 2 d 矩形 

由 d 的意义对知，尸 2 中任何两个 S 屮的点的距离都不小于 A 由此 W 以推出矩形/?中最 
多只有6个 S 中的点。事实上，我们可以将矩形/?的长为 2 d 的边3等分，将它的长为 d 的边 
2 等分，由此导出 6 个 U/2) x (2d/3) 的矩形。如图 2-l 】（ a) 所示。 



图 2-丨1 矩形开中点的稀疏性 

若矩形 K 中有多于6个 S 中的点，则由鸽舍原理易知至少有一个 （ rf /2) x (2 J /3) 的小矩 
形中有2个以上 S 中的点。设是这样2 个点，它们位于间一小矩形中，则 

(^( u ) - x ( v )) 2 + ( y ( u ) - y ( v )) 2 ^ ( d /2) 2 + (2 d /3) 2 - 

因此， distanee ( u , ^ ^ 5 d /6 < <^。这与 ri 的意义相矛盾。也就是说矩形/?中最多只有6个 
S 中的点。图2 ，11 ( b ) 是矩形 R 中恰有6个 S 中点的极端情形。 ftl 于这种稀疏性质，对于匕屮 
任一点 P , P 2 中最多只有6 个点与 它构成最接近点对的候选者。因此，在分治法的合并步骤中, 
我们最多只需要检查6 x U /2 = 3 m 个候选者， 而不是 fi 2 /4 个候选者。这是 々就 意味着我们 wj 
以在 GU ) 时间内完成分治法的合并步骤呢?现在还不能作出这个结沦。因为我们只知道对亍 
P , 中 每个& 中的点最多只需要检查 S 2 中6个点，但是我们并不确切地知道要检查哪6 个点。 

为解决这一问题，我们吋以将 p 和匕中所有心的点投影到垂直线/上。由于能与; ) 点一起构 
成最接近点对候选者的心中点一定在 矩形々 中，所以它们在直线 Z h 的投影点距^在/ t 投 
影点的距离小于 A 由 h 面的分析可知，这种投影点最多只有6个。因此，若将/^和 P 2 中所有 
S 中点按其 7 坐标排好序，则对 h 中所有点，对排好序的点列作一次扫描，就可以找出所有最 
接近点对的候选者。对匕中每一点最多只要检查 P 2 中排好序的相继6个点。 

至此,我们给出用分治法求二维点集最接近点对的算法 Cpair2 如下： 
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bool Cp^r2( S, d) 


2 . 


3. 


4. 


5. 


6 . 


n = f S I; 

if (n < 2) i d = »; 

return false; 

! 

m = S 中各点 x 间肀标的中位 数 ； 

构造 S1 和 S2; 

//SI = Ip ^ S I x{p) < = ml , S2 = 6 S I x(p) > mi 

Cpair2(Sl ,dl); 

Gpair2(S2,d2 )； 
dm - min(dl ,d2); 

设 Pi 是 SI 中距垂直分割线 1 的距离在 dm 之内的所有点组成的集合； 

P2 是 S2 中距分割线 1 的距离在 dm 之内所有点组成的集合； 

将 W 和 P2 中点依其 y 坐标值 排序； 

并设 X 和 Y 是相应的已排好序的点列； 

通过扫描 X 以及对于 X 中每个点检査 Y 中 5 其距离在 dm 之内的所有点（最多 6 
个）可以完成 合并； 

当 X 屮的扫描指针逐次向上移动时， Y 中的扫描指针可在宽为的一个区间内 
移动； 

设 dl 是按这种扫描方式找到的点对间的最小距离； 

d = min(dm,dl) ; 
return true; 


下面分析算法 Cpair2 的计算复杂性。设对于 n 个点的平面点集 S ， 算法耗时 r ( n )。 算法的 
第1步和第 5步用了 0( n ) 时间。第3步和第6步用了常数时间。第2步用了 2 rU /2) 时间 D 
若在每次执行第4步时进行排序，则在最坏情况下第4步要用 O (〃 log / i ) 时间。这不符合我们 
的要求。因此，在这里我们要作一个技术处理。我们采用设计算法时常用的预排序技术，在使用 
分治法之前，预先将 S 中〃个点依其 y 坐标值排好序，设排好序的点列为 P * 。在执行分治法的 
第4步时，只要对 P * 作一次线性扫描，即可抽取出我们所需要的排好序的点列 X 和然后， 
在第5步中再对 X 作一次线性扫描，即可求得出。因此，第4步和第5步的两遍扫描合在一起 
只要用时间。这样，经过预排序处理后算法 C p air2 所需的计算时间汽〃）满足递归方程 

, rt<4 

i2 7"( n/2) + 0( n) n ^ 4 

由此易知， r ( n ) = OUlognh 预排序所需的计算时间显然为 OUlogW 。 因此,整个算 
法所需的计算时间为 OUlogn )。 在渐近的意义下，此算法已是最优 算法。 


在具体实现算法 Cpair2 时，我们分别用类 PointX 和 PointY 表历依: c 坐标和依 y 坐标排序 


的点 


class PointX 


public : 

int operator < = (PointX a) conat 
I return (x < = a-x); I 


^ 30 ^ 







MergeSorl( Y, n )； 

PointY *Z = n^w Point Y [ n j; 
closest (X, Y ， Z, 0 ,n- l,a,b,d); 
delete [] Y ； 
dekte I ; Z: 


private ： 

int ID; // 点编号 
float x, y ； // 点坐标 

: . 

class PointY j 
public ： 

int operator < = (PointY a) const 
I return (v < = a. v) i! 

^ w 

// 同一点在数组 X 中 的坐标 
//点坐标 

參藝垂 1 / 1 \ • • • • •• Jt \ ■■鵞 _ ^ * • • 

平面上任意两点 u 和〃之间的距离可计算如下: 

template < class Type > 

inline float distance (const Type& u y const Type& v) 

i 

float dx = q.x - v^x; 
float dy - u，y - v- y ； 
return sqrt( dx * dx + dy * dy); 


在算法 Cpair2 中，用数组 X 存储输入的点集。在算法的预处理阶段,将数组 X 中的点依 x 
坐标和依 y 坐标排序，排好序的点集分别存储在数组 X 和数组 Y 中。经过预排序后，在算法的 
分割阶段，将子数组 X [ /: r ] 均匀地划分成两个不相交的子集的任务就可以在 00) 时间内完 
成。事实上，我们只要取 m = (/+ 厂 )/2 , 则 X [/: m ]# X [ m 十1:厂]就是满足要求的分割。依 
r 坐标排好序的数组 Y 用于在算法的合并步中快速检查 d 矩形条内最接近点对的候选者。 

• r • • m w • 一 • 产 •••%• ^^9 ••/ j • a ^ • « • • * ， • r ■ 、 • 春，％ • k j • r • ， ' r 〆 一 •• _ ， • _ %% m < ^ % ， •••• V 

bool Cpair2(PointX X[L int n ， PointX& a, 

PointX& b, float & d) 

j 

if (n < 2) return false; 

MergeSorl(X,n); 

PointY * Y = new PointY [n^; 
for (iut i - 0; i < n; i + +) j 

// 将数组 X 中的点复制到数组 Y 中 



int p ； 
float x, y ； 
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wlurn Iruc; 


算法 Cpair 2 屮，具体计算最按近点对的 T 作由函数 closest 完成 

void closest(PointX XL \ PoinlY Yrh PointY 7[], 

int I , ini r ， PoirilX & PuintX ^ 1>, float & (\) 

I 

I 

I 

if ( r-l = - i ) V /2 点的情肜 
a = X '. lj ; 

b = Xl rJ ； 

d ; distancc ( XLl ], XrrJ ); 
return ；! 

if ( r -卜- = 2) i //3 点的情形 

float J 1 = dislance ( Xn ]» X[l + 1 ]); 
float d 2 = dlsLance ( X , 1 + 11, X [ r ]); 
floal d 3 = dislarioe ( X 1], X [ rl ); 
if (<n < = dl & & il ) < = ( B ) i 

ii = xLi ]； 

b = xLU ij ； 

d - Ul; 

return; 1 

if ( d 2 < = d 3) |a = X [ I + ll ； 

V ) = X [ r ]; 

d = d2 ；| 

tjbe i a = X [ l ]; 

b = Xrr ]; 

d = d3；! 

return ; • 

// 多于 3 点的情形，用 分治法 

int in = (1 + i ，)/2; 



for (int i = 1; i < = r; i + +) 

if (yir.-p > m) + ] = yli ]； 

eW Z[ f + + ] = Yri]; 

closest(X,Z, Y ， l ， ni ， a ， b,d); 
float dr; 

PointX ar. br; 

closest(X ， Z, Y，m + 1 ， r ， ar ， br ， dr); 
if (dr < d) <a =ar; 

b - hr ; 

d - dr ;! 

Mer^(Z, \Xm,T);// 重构数组 Y 
//d 矩形条内的点置于 Z 中 

iat k - 1; 

for (ini i = 】； i < = r ； ) + + ) 
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if (fabs( Y[mj .x - V.iJ.x) < d)Z[k+ +」= 

// 搜索 ZU:k-lj 、 

for (int i = 1; i < k; i + + )i 

for (iril j = i + 1; j < k && Z[j] ■ y - Z.i] .y < d; 

j + + ) i 

float dp = distance(ZLij ^ Z[jJ); 
if (dp < d) f 

d = dp; 

a 二 X[Z[i] *pl ； 

b = I 


2.11 循环赛日程表 

分治法不仅可以用来设计算法，而在其他方面也有广泛应用。例如可以用分治思想来设 
计电路、构造数学证明等。现举一例加以说明。 

设有^ 个运动员要进行网球循环赛。现要设计一个满足以下要求的比赛日 程表： 

(1) 每个选手必须与其他《 - 1个选手各赛一次。 

(2) 每个选手一天只能赛一次。 

(3) 循环赛一共进行 a - 1天。 

按此要求可将比赛日程表设计成有 a 行和 n 1列的一个表。在表中第；行和第 y 列处填 
人第纟个选手在第/天所遇到的选手。 

按分治策略，我们可以将所有选手对分为两组，〃个选手的比赛 FI 程表就可以通过为 a/2 
个选手设计的比赛日程表来决定。递归地用这种一分为二的策略对选手进行分割，直到只剩下 
2 个选手时，比赛日程表的制定就变得很简单。这时只要让这2个选手进行比赛就可以了。 

图2 - 12所列出的正方形表是8个选手的比赛日程表。其中左上角与左下角的两小块分别 
为选手1至选手4和选手5至选手8前3天的比赛日程。据此，将左上角小块中的所有数字按 
其相对位置抄到右下角，将左下角小块中的所有数字按其相对位置抄到右1：角，这样我们就分 
别安排好 了选手 1至选手4和选手5至选手8在后4天的比赛日程。依此思想容易将这个比赛 
曰程表推广到具有任意多个选手的情形。 



图 2-12 8个选手的比赛日程表 
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在一般情况下，算法可描述如下: 

• • • • •• • • 

void Table(int k, ini ^ ^ a) 


int n = 1; 

for (int i - 1; i < = k; i + + ) n x = 2; 

for (int i= 1; i < = n ； i + + ) a[ 1 ][i] = i; 

int m = 1; 

for (int s = 1; s < = k; s + + ) I 
n/ = 2i 

for (int t=l;t<=n;t+ + ) 

for (int i = m + 1; i < = 2 * m; i + + ) 
for (int j - m + l; j < = 2 * m; j + + ) > 

+ (t - 1) ^ m * 2] = a[i - m][j + (t - 1) ^ m * 2 - mj; 

a[i][j + (t - 1) * m * 2 - m] = a[i - m] [j + (t - 1) ^ ra * 2]; I 

m * =2; 



习题 2 


2 -1 证明 Hanoi 塔问题的递归算法与非递归算法实际上是一回事 c 

2-2 下面的7个算法与本章中的二分搜索算法 BinarySearch 略有不同。请判断这7个算 
法的正确性。如果算法不正确，请说明产生错误的原因。如果算法正确，请给出算法的正确性 
证明。 

• • A k ^ ^ r ■ r • 一 • •• r I r ^ 一镰 • • J • • • r * \ 1 r • r 沪 / 一 / fV ， 丨 • r •• • •• • • J • • • ••产 z z • •• • • 八 • J _• • •• mm Am ^ j •内 w m 

template < class Type > 

int Binary Search 1 ( T ype ] ， const Type& x，int n) 

) 

int left = 0; int right = n - 1; 
while (lftft < = right) | 

int middle = (left + right)/2; 
if (x = = a[ middle]) return middle; 
if (x > a[ middle]) left = middle; 
else right - middle; 

i 

return - 1; 


template < class Type > 

int BinarySearch2(Type a[]，const Type& x r int n) 

\ 

int left = 0; int right = n - 1; 
while (left < right - 1) | 

int middle - (left + right)/2; 
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if (x < a[middle]) right = middle; 
else lefl - middle; 


if (x = = a L left]) return left; 
else return - 1 ； 


template < class Type > 

int BinarySearch3( Type a[]，const Type& x, int n ) 

I 

int left - 0; int right = n - 1; 
while (left + 1 ! - right) \ 

int middle = (left + rigfi0/2; 
if (x > = aLmiddle]) left = middle; 
else right = middle; 

參 

if (x = - a[Ieft]) return left ； 
else return - 1; 


template < class Type > 

int BinarySearcM(Type a[ ] ， const Type& x，int n) 

I 

1 

if(n>0 &&x> = a[0 ])! 
int left = 0; int right : r n - 1; 
while (left < right) | 

int middle = (left + right)/2; 

if (x < a[middle]) right = middle - 1 ； 

else left = middle ; 

I 

if (x = = a[left j) return left; 



template < class Type > 

int BinarySearch5 (Type a[ ], const Type& x f int n) 

I 

J 

if (n > 0& &x > = a[0])) 
int left = 0; int right = n - 1; 
while (left < right) \ 

int middle = (left + right + 1)/2; 
if (x < a[middle]) right = middle - 1 j 
ebe left = middle ; 












if (x = ^： al_Ml]) return left; 

蜃 

return - 1; 


template < class Type > 

int BirmrySearch6( Type a[] ， i^onst Type& x t int n) 

I 

i 

I 

if (n > 0&&x > = a[0]) i 
int left - 0; int right = n - 1 ； 
while (left < right) \ 

int middle = (left + right + J )/2; 
if (x < al.middle]) right - middle - 1 i 
ebe left - middle + 1 ; 

I 

if (x = - a[leftj) return left ； 

I 

return - 1; 


template < class Type > 

int Binary Search? (T ype a[ 1, const Type& x, int h) 

< 

if (n > 0&&x > - a[0]) \ 
ini left = 0^ int right - n - 1; 
while (left < right) | 

int middle - (left + right + 1 )/2; 
if (x < a[middle]) right = middle; 
else left = middle ; 

I 

t 

if (x = = a[leftj) return ]eft; 

I 

return - 1; 


2-3 设 a [0 :n -1] 是一个已排好序的数组 # 改写二分搜索算法，使得当搜索元素％不 
在数组中时，返回小于^的最大元素位置 i 和大于 x 的最小元素位置 y 。 当搜索元素在数组中 
时， i 和 j •相同，均为 X 在数组中的 位置。 

2-4 给定两个整数 u 和心它们分別有肌和 a 位数字，且 m 矣/ I 。用通常的乘法求⑽ 
的值需要 0 { mn ) 时间。我们可以将 w 和 w 均看作是有《位数字的大整数，用本章介绍的分治 
法，在 0( a 1 % 3 ) 时间内计算 m 的值。当 m 比《小得多时，用这种方法就显得效率不够高。试设 
计一个算法，在上述情况下用 OUm b « (3/2) ) 时间求出⑽的值。 

2-5 我们在用分治法求两个位大整数“和 u 的乘积时，将 w 和 t 都分割为度为"/3 
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位的 3 段。证明可以用 5 次〃/3位整数的乘法 求得⑽ 的值。按此思想设计一个求 M 个大整数乘 
积的分治算法，并分析算法的计算复杂性。（提不^位的大整数除以一个常数 A •司以在外吋 
间内完成。符号0所隐含的常数可能依赖于 O 

2-6 对任何非零偶数《，总呵以找到一个奇数 m 和一个正整数I使得《 = m2 4 。为 r 
求出两个 n 阶矩阵的乘积，可以把-个 n 阶矩阵分成 m x m 个子矩阵，每个子矩阵有2 〃 x 2 A 
个元素。当需要求2 W 的子矩阵的积时，使用 Strain 算法。设计.-个传统方法4 Sim 娜 n 算 
法相结合的矩阵相乘算法，对任何偶数心都可以求出两个 a 阶矩阵的乘积。并分析算法的计 
算时间复杂性 

2-7 设 P ( x ) ^ a Q + ap +…+ a d x d 是一个 d 次多项式。假设 Q 有一算法能在 0 ( i ) 
时间内计算一个（次多项式4 一 个一次多项式的乘积，以及一个算法能在时间内汁 
算两个纟次多项式的乘积。对于任意给定的 J 个整数 以，^，… ，& ，用分治法设计一个有效算 
法，计算出满足 Pin ,) = P ( n 2 ) =…= P { n d ) = 0 H . 最高次项系数为1的 d 次多项式/ > U ) , 
并分析算法的效率。 

2-8 设^个不同的整数排好序后存下 T[0:n-1] 中。若存在一个卜 1丨，0在；< ^使 
得 T[r」 =(，设计一个有效算法找到这个下标。踅求算法在最坏情况下的计算时间为 
0( loga ) 0 

2-9 设 T 〔0: - 1] 是 n 个元素的一个 数组；:对任 一元素 x . 设 X )=:丨 i 1 T [ i ] - .t i c . 
当 I SU ) 1 > n /2 时，称 X 为 T 的主元素。设计一个线性时间算法，确定 - I ]是否有 
一个主元素 (） 

2-10 若在习题 2-9 中，数组 T 中元素不存在序关系，只能测试任意两个元素是否相等， 
试设计一个有效算法确定 T 是否有一主元素。箅法的计算复杂性应为电进一步， 
能找到一个线性时间算法吗？ 

2-1) 设 a[0^ - 1] 是一个有^个元素的数 m,H0$ k 矣 n — I )是-个非负整数试 
设计一个算法将子数组心0 4] 与 a[“ 1: n - 1 ] 换位。要求算法在最坏情况下粍时 ） ， 且 
只用到 0(1) 的辅助空间。 

2-12 设子数组 a [0: A ] 和十1:卜 1] 已排好序 (0 ^ k ^ n - 1)。试设计一个合并 
这两个子数组为排好序的数组 a[0：n - 1] 的算法。要求算法在最坏情况下听用的计算时间为 
OU)，a 只用到 0(1) 的辅助空间。 

2-13 如果我们在合并排序算法的分割步骤中，将数组 a]0a - U 划分为个子数 
组，每个子数组中有 0(A) 个元素。然后递 IH 地对分割的子数组进行排序，最后将所得到 
的 L ^」个排好序的子数组合并成所要求的排好序的数组!几设汁一仑实现 L 述策 
略的合并排序算法，并分析算法的计算复杂性。 

2-14 对所给元素存储于数组屮和存储于链表中两种情形，写出自然合并排序算法。 

2- 】5给定数组 a:0 : a - 1:，试设计〜个算法，在最坏情况下用[ 3»/2 - 21次比较找出 
a[0：ra - 1] 中元素的最大值和最小值。 

2-16 给定数组針0:« - 1]，试设计一个算法，在最坏情况下用^ + Flog 2次比较找 

出 atO；n - 1] 中元素的最大值和次大值。 

2]7设心，心， •••，& 是整数集合，其中每个集合\(1在 t 矣 A) 中整数取位范围是1到 
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«，且 D I Si I = n ， 试设计一个算法在时间内将 A ， k S 2 , …，乂分别排序。 

\ 

2-18 试证明，在最坏情况下，求 n 个元素组成的集合 S 中的第 k 小元素至少需要 n + 
min ( k j n - k -\- \ ) - 2 次比较。 

2-19 如何修改 Quicksort 才能使其将输人元素按非增序排序？ 

2 -20 对一个随机化算法，为什么我们只分析其平均情况下的性能，而+分析其最坏情 
况下的性能？ 

2-21 在执行 RandomizedQuicksort 时，在最坏情况下，调用 Random 多少次?在最好情况 
下又怎样？ 

2 -22 试设计一个 0( n ) 时间算法，使之能产生数组 a [0 :n - 1] 元素的一个随机排列。 

2-23 试用 while 循环消去算法 Quicksort 中的尾递归，并比较消去尾递归前后算法的 
效率。 

2-24 试用栈来模拟递归，消去算法 Quicksort 屮的递! U 。 并证明所需的栈空间为 

(Klogrt )0 

2-25 在算法 Select 中，输入元素被划分为5个一组，如果将它们划分为7个一组，该算法 
仍然是线性时间算法吗?划分成3个一组又怎样？ 

2-26 试说明如何修改快速排序算法，使它在最坏情况下的计算时间为 

2-27 给定一个由^个互不相同的数组成的集合5,及一个正整 数&矣 、试设计一个 
0( n ) 时间算法找出 S 中最接近 S 的中位数的 A 个数。 

2-28 设 X [0: « - 1 ] 和 Y [0： a - 1 ] 为两个数组，每个数组屮含有 a 个已排好序的数。试 
设计一个 0(\ o g n ) 时间的算法，找出 X 和 Y 的个数的中位数。 

2-29 考察如图2 -13 所示的有两个输入端和两个输出端的二位置开关。当开关处于位 
置1时，输人1和2分别产生输出1和2;当开关处于位置2时，输入1和2分别产生输出2和 
1 。使用这种开关设计一个有/ 1 个输入端和 / i 个输出端的开关网络，实现将输入的个数值以 
它们的；1!种不同排列的任何一种排列输出(通过开关位置的适当选择)。要求网络中使用的开 
关个数为 OU — )。 


糯入1 • - 


—^ ^ ^ ■ — 

- • 输出 f 




输入2 • - 


- 

- - 输出2 


位置 I 的连接法 
位置2的连接法 


图 2 -13 二位置开关 

2-30 某石油公司计划建造一条由东向西的主输油管道。该管道要穿过一个有 n n 油井 
的油田。从每口油并都要有一条输油管道沿最短路经(或南或北）与主管道相连 。如 果给定 n 
口油并的位置，即它们的 X 坐标和 y 坐标，应如何确定主管道的最优位置，即使各油井到主管 
道之间的输油管道长度总和最小的位置?证明可在线性时间内确定主管道的最优位置。 

2-31 在一个由元素组成的表中，出现次数最多的元素称为众数。试写一个寻找众数的 
算法，并分析其计算复杂性。 
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n 

2-32 对 J : n 个带有正权， u ，2, …，议，„， W . X ) = 1的互不相问的九素 - t 〗 ， _ x 2 , …， 

i= 1 

〜，其带权中位数& 满足： 



(1) 试证明的不带权中位数是带权％ = l / n,i = 1，2, …， n 的带权中位 
数； 

(2) 说明如何通过排序，在最坏情况下用 OUlo g n ) 时间求出/ I 个元素的带权中 位数； 

(3) 说明如何利用一个线性吋间选择算法(如 Sda ， l )， 在最坏情况下用 O ( n ) 时间求出 n 
个元素的带权中位数； 

(4) 邮局位置问题定义为：已知 n 个点 Pi ， p 2, …，以及与它们相联系的权, W 2，“- , 

要求确定一点 〆 /)不一定是〃个输入点之一），使和式 i ； 达到最小，其中， 

I 7 I 

表示 a 4 &之间的距离 c 试论证带权中位数是一维邮局问题的最优解。此时 d { a ^ b ) 

=! a - b I o 

(5 ) 在二维的情形如何找最优解？ 

2-33 考虑国际象棋棋盘上某个位置的一只马，它是否可能只走63步，止好走过除起点 
外的其他63个位置各一次？如果有一种这样的走法，则称所走的这条路线为一条马的周游路 
线。试设计一个分治算法找出这样的一条马的周游路线。 

2-34 Gm v 码是一个长度为 2 n 的序列。序列中无相同元素，每个元素都是长度为《位的 
串，相邻元素恰好只有一位小 T 司。用分治策略设计一个算法对任意的^构造相应的 Gmy 码 （ 
2-35 设冇 n 个运动员要进行网球循环赛。设计一个满足以下要求的比赛 H 程表： 

(1) 每个选手必须与其他 n ~〗个选手各赛一次。 

(2) 每个选手一天只能赛一次。 

(3) 当《是偶数时，循环赛进行天。当 a 是奇数时，循环赛进行7天。 
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第 3 章 


动态规划 


学习要点 

■ 理解动态规划算法的概念 
• 掌握动态规划算法的基本 要素： 

(1) 最优子结构性质 

(2) 重叠子问题性质 

- 掌握设计动态规划算法的 步驟： 

(1) 找出最优解的性质，并刻画其结构特征 

(2) 递归地定义最优值 

(3) 以自底向上的方式计算最优值 

(4) 根据计算最优值时得到的信息构造最优解 

• 通过下面的应用范例学习动态规划算法设计策略: 
(!) 矩阵连乘问题 

(2) 最长公共子序列 

(3) 最大子段和 

(4) 凸多边形最优三角剖分 

(5) 多边形游戏 

(6) 图像压缩 

(7) 电路布线 

(8) 流水作业调度 

(9) 背包问题 

(10) 最优二叉搜索树 


动态规划算法与分治法类似，其基本思想也是将待求解问题分解成若十个子问题,先求解 
子问题，然后从这些子问题的解得到原 M 题的解。 M 分治法不同的是，适合于用动态规划法求 
解的问题，经分解得到的子问题往往不是互相独立的。 若用 分治法来解这类问题，则分解得到 
的子问题数 U 太多，以至于最后解决原 H 题需要耗费指数时间然而,不同子问题的数目常常 
只有多项式量级。在用分治法求解时，有些子问题被重复 计算了 许多次。如果我们能够保存 Q 
解决的子问题的答案，而在需要时再找出 Ll 求得的答案，这样就吋以避 免大量 的重复 H 算，从 
肘得到多项式时间的算法。为 r 达到这个 h 的，我们可以用一个忐来 s 录所有已解决的子问题 
的答案。不管该子问题以后是否被用到，只要它被 H •算过，就将其结果填人犮中。这就是动态规 
划法的基本思路。其体的动态规划算法多种多样，何它们具有相冋的填衣格式 

动态规划算法通常用于求解具有某种最优性质的问题。在这类问题中，可能会有许多吋行 
解。每一个解都对应于一个值，我们希望找到具有最优值(最大值或最小值）的那个解，、设计一 
个动态规划算法,通常可按以下几个步骤进行 •. 

(1) 找出最优解的性质，并刻画其结构特征〜 
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(2) 递归地定义最优值， 

(3) 以 A 底向 _L 的方式计算出最优值。 

(4) 根据计算最优值时得到的倍 /J、, 构造-个最优解。 

步骤 U) 〜 （3) 是动态规划算法的基本步骤^在只需要求出最优 tf_[ 的情形，步骤 (4) 可以 
省去。若谅要求出问题的 -个 最优解，则必须执行步骤 (4). 此吋，在步骤 (3) 中计算最优值吋, 
通常耑记录更多的信息，以便在步骤 ( 4 ) 中，根据所记 M 的倍总，快速构造出一个最优解 。 

F 而我们以具体的例子来说明如何运用动态规划算法求解问题，并分析呵用动态规划算 
法求解的问题所成具备的一般特征、 

3.1 矩阵连乘问题 

给定 n 个矩阵 ，心 ，…,木,：，其中，土与义, + 1 是可乘的」=1,2 ,…， n - 丨。我们要计 
算出这《个矩阵的连乘积 AM 2 ，…， 

由于矩阵乘法满足结合律，故计算矩阵的连 乘积可 以冇许多小同的计算次序 、，这 种计算 K 
序4以用加括号的方式来确定 荇-个 矩阵连乘积的计算次序完全确定，也就是说该连乘积 ti 
完全加括号，则我们可依此次序反复调用2个矩阵相乘的标准算法计算出矩阵连乘积。完全加 
括号的矩阵连乘积可递归地定 义为： 

(1) 笮个矩阵是完全加括号的； 

(2 ) 矩阵连乘积4是完全加括兮的，则 A 可表示为2个宂全加括号的矩阵连乘积 B 和 C 
的乘积并加括号•，即4 = ( BC ), 

例如，矩阵连乘积 AA 2 A 3 A 4 可以有以 F 5种不同的完全加括号方式1 

j (A 2 ( A 3 A 4 ))) 

(i 4 】 （ ( A2A2) A ^)) 

(( A j At ) (^ 3 ^ 4 )) 

((A“_4 ； 2i43))A4) 

(((^ 1^2 )^4.^) A4 ) 

每一种完全加括 y 方式对应干一种矩阵连乘积的计算次序，而这种计算次序与计算矩阵 
连乘积的计算 a 有着密切的关系。 

痒先我们来考虑汁算2个矩阵乘积所耑的计算量。 

计算2个矩阵乘积的标准算法如下，其中， m，ca 和 rh,ch 分别表示矩阵 A 和的行数和列数。 

void matrixiVliiifciply(inr ^ ^ £t, ini « ^ b v int 、 * l\ int ra, ini ca, i『U rb，im oh) 

I 

if (cal = rh ) error ( w 矩阵 4 、 R j 乘") ; 
for (int I = 0; i < ry; i 十 + ) 
for (ini j = 0 ； j < c\>； j + + ) i 

ini 洲 m = a\ i], ()] ^ bj ()]「j 丨； 

hr (hit k = 】： k < cn; k + +) 
sum + ^ n\ i^kj •> h\ kjjj 」； 
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矩阵 4 和 2? 是可乘的条件是矩 R 4的列数等 F 矩阵 B 的行数。若 A 是-个 p X q 矩阵， 
B 是- ■个 gx r 矩阵，则其乘积 C = 姑一个 p x 「矩阵。在卜，述计算 C 的标准算法巾，主® 
计算量在三重循环，总共需要次数乘 

为了说明在计算矩阵迮乘积时，加括V方式对整个计算量的影响，我们来肴一个计算3个 
矩阵 |A】，A 2 ,4 3 _; 的连乘积的例子。设这3个矩阵的维数分别为10 x 100，U)0 x 5,和5 x 50: 
若按第一种加括号方式来计算，则计算3个矩阵连乘 积耑要 的数乘次数为 i 0 x 
100 x 5 + 10 x 5 x 50 = 7 500。若按第二种加括兮方式 (4 来计算3个矩阵连乘积总 
共需要100 x 5 x 50 + H) x 100 x 50 = 75 000次数乘。第二种加括号方式的计算量是第一种 
加括兮方式计算量的〖0侣。由此可见,在计算矩阵连乘积时，加括兮方式，即计算次序对汁算 
量有很大影响。千是，人们自然会提出矩阵连乘积的最优 if 算次序问题,即对于给定的 n 个矩 
阵(其屮，矩阵山的维数为 x & J =〗，2,…，》)，如何确定计算矩阵连乘 
积，…，—个计算次序(完全加括号方式），使得依此次序计算矩阵连乘枳需要的数 
乘次数最少。 

穷举搜索法是最容易想到的解法。算法列举出所冇可能的计算次序，并计算出每一种汁算 
次序相成需要的数乘次数，由此找出一种所需数乘次数最少的汁算次序，然而，这样做计算量 
太大。事实匕对于〃个矩阵的连乘积，设有 P ( n ) 个不间的计算次序。由于我们可以先在第公 
个和第 A + 1个矩阵之 M 将原矩阵序列分为两个矩阵子序列 j = 1，2,…， a - 1;然后分别对 
这两个矩阵子序列完全加 括号; 最 G 对所得的结果加括孕，得到原矩阵序列的一种完全加括号 
方式。由此，可以得到关于 P ( n ) 的递归式如下 t 

1 n = ] 

n~ I 

^ P ( k ) P(n - k ) n > 1 

解此递归方程可得 JU) 实际上是 Catalan 数，即 PU) ：= CU - 】），其中, 



cu ) 


2 n 


0(4 n / n 3/2 ) 


n 


也就是说， p (幻是随 n 的增长呈指数增长的。因此，穷举搜索法不是一个有效算法。 

下面我们考虑用动态规划法解矩阵连乘积的最优计算次序 问题 。如前所述，我们按以下儿 
个步骤来进行。 


1. 分析最优解的结构 


设计求解具体问题的动态规划算法的第1步是刻 画该问 题的最优解结构特征。为方便起 
见，将矩阵连乘积 4 A + r “' 简记为 A [~]。 我们来看 ih 算，1 ^]的-•个最优次序。设这个 
计算次序在矩阵4和 A i +1 之 「 Hj 将矩阵链断开，1 《 k < n ， 则完全加括兮方式为 
(( A 「" A & K 人依此次序，我们先分别计算 A [\： k ] 不 tl /4 [A + l : n ], 然后将 计算结 

果相乘得到总计算量为的计算 M 加 + ㈧的汁 算量， # 加上 
A] 和 A[^ + l:n] 相乘的计算量 c 

这个问题的一个关键特征是:计算4 [ 1: n ] 的一个最优次序所包含的计算矩阵子链 A；l： 
灸]和4 + 1: n ] 的次序也是最优的。事实上，名有一个计算 A ：\： k ] 的次序需要的讣算量史 

少，则用此次序替换原来汁算 A [\^. k ] 的次序，得到的计算 A [ l ： n ] 的次序需要的计算量将比 
最优次序所需计算量更少，这是一个矛盾。同埋町知，计算 A ： l ： n ] 的一个最优次序所包含的 
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汁算矩阵子链 A：k + 1：; ? ：的次序也是最优的。 

闪此，矩 Pi 连乘积 U 算次序问题的最优解包含着其+问题的最优解。这种性质 称为诚 优子 
结构性质。一 t 问题的最优子结构性质足该问题可用动态规划算法求解的 5 T 者特征。 

2,建立递归关系 


设汁一个动态规划算法的第2汰是递 !U 地定义最优值。对于矩阵连乘积的最优 U 算次庁 • 
问题，设计算 A [ i ： j ) A ^ i ^ j ^ n ，所需的最少数乘次数为 m [ i ][ yj ，则原问题的最优值为 

m [ i ] \ n ] 0 

当 / = j U ' J ', A . i : j ) = A l 为中 一 矩阵，无需计算，因此 m [ / ] L t j = 0 = 1，2, 

当 Z < /时，可利用最优子结构性质来计算事实上，若汁算 A [/: y ] 的最优次序 
& A k 和4々 +1 之间断开， i ^ k < /，则 m [ i ][ j ] = + ni~_k + 1]:/: + p ,- ipkP ； -^ f 

在计算时我们并不知道断开点纟的位置，所以&还未定。不过 A 的位置只有/ - 纟 个町能，即 

+ - 1;.. 因此 J 纪这卜/个位置中使汁算 M 达到最小的那个位置.从而 

[j ] 可以递！) I 地定义为 


inij ) 


0 


min I w [ / ] [ /p ] + rn [ k 1 ][)] 


f ^ l ] P k Pj ' 1 < J 

爪 [ U 给出了最优£， Wil 算 A ： i ： j ] 所需的最少数乘次数。同时还确定了计算 
A [ i ： j ] 的最优次序中的断幵位置幻也就是说，对于这个々有 

- m [ z ] [ /r j + m[k + \][ j ] +■ p ( _[ p k pj 

若将对砬于的断开位置记为3: f ] 0 ] ，在计算出最优值爪「厂 ] 后，可递归地 
rfl 构造出相应的最优解。 


3,计算最优值 


根据 if 算 nx [ l ][ j ] 的递归式，容易写一个递! I 】算法来计算稍后我们将看到，简 
单地递归汁算将耗费指数计算时间。然而，我们注意到，在递归汁算过程中，+同 的孓问 题个数 
只有外 d 个。事实 h , 对于1 «不同的有序对 （ i ， y ) 对应于不同的子问题。因此， 

不同子问题的个数最多只有 n =沒 U 2 ) 个。由此可见,在递归计算时 ，许多 子问题被重 

复卟算多次。这也是该问题可用动态规划算法求解的又一® f 特征。 

用动态规划算法解此问题，町依据其递归式以自底向上的方式进行计算。在计算过样屮, 
保存已解决的子问题答案。毎个子问题只计算一次，而在后时需要时只 ® 简单查一下，从 fft 避 
免大 M 的®复计算，最终得到多项式时间的算法 -下面 所给出的计算的动态规划算 
法 MatriKChain 小，输人参数卜 0 , 以 ，…，/> J 存储于数组 p 中。算法除了输出最优值数组 m 外 
还输出记录最优断开位 S 的数组 s 。 

void Ma1rixChain( int ^ p, int n. itil * ^ m f int ^ * s) 

I 

< 

I 

for (ini i=1;i<=n;i+ + ) m.iJLi. = 0; 
for ( mt r = 2; r < = 【j ; r + 十） 

for (int i = 1; i < = n - r + 1 ; i + + ) \ 
int j = i + r - 1; 
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m[i fjJ = mfi + U.jJ + firi - 】 J p L iJ* pLjJ; 

«[ ij[jl = i ； 

for (iril k^i+1;k<j:k+ + )i 

int t - mLiJLk. + mi.k + 1J | j 

+ p : J ^ 1J ^ p.kl ^ p r j]; 

if(t < mLi.ljJ) I 

m r . ij r _jj = 1; 

= 1c；' 


算法 MalrixChain 宵儿计算出 mi_ 〖][〖]= 0,〖 = 】 ， 2 .… ， fi ， 然后，再根据递归式，按矩阵 
链长递增的方式依次计算 + 1]，i = 1，2 •…， 介 一 M 矩阵链 LC 度为+ 2]， 
i : U2, …-2,(矩阵链长度为3〉；“。在 HI? mLi ][/] 时，只 用到巳 计算出的和 

n)[k -j- 1 j[_/.] f 、 

例: 设要计算矩阵连乘积 4M 2 AW 4 ^4 5 A 6 ，其中各矩阵的维数分別为： 


Ai 


A 2 


A 3 



a 5 


a 6 


30 x 35 35 x 15 15 x 5 5 x 10 10 x 20 20 x 25 

动态规划算法 MatrixChain 【|•算 m [ i ][ j ] 先后次序如阁 3-[(a) 所示； H •算结果 ny [ l ][ j ] 
和 s[i][)]，l 在 f 矣 j •矣分別如图 3^ l(b) 和 (c) 所示。 




2 

3 

4 

5 

6 


0 15750 787 S 9375 11875 15125 

0 2625 4375 7125 10500 

0 750 2500 5375 

0 1000 3500 

0 5000 

0 


m [“)] 

< b ) 


2 

3 

4 

5 

6 



a [ i ， j ] 

< c > 



W 3-1 计算的次序 

例如,在计算 m[2j[5] 时，依递归式有 

■m[2][2] + m：3][5j + p [ p 2 p ^ = 0 + 2500 + 35 x 15 x 20 = 13 0(KJ 

m [2][5] 二 miiV ni 2][3] + m[4 [5] + p \ p ^> P5 ~ 2625 + 1000 + 35 x 5 x 20 = 7 125 

m[2][4] 十 mL5j[5] + p ”, 4 p 5 = 4375 + 0 + 35 x 10 x 2() = 11 375 

= 7 125 

= 3,因此， s[2X5〕= 3。 

算法 Matrix Chain 的主要 i 十算 fi 取决 T‘ 程序中对 r，i 和左 的二重 循环。循环体内的计算量 
为0⑴，时-:重循环的总次数为此，该算法的计算时间上界为 0 U 3 )。 算法所占用 
的空间®然为 0U 2 )、 由此可见，动态规划算法比穷举搜索法要有效得多。 
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4. 构造最优解 


动态规划算法的第4步是构造问题的一个最优解。算法 MatrixCkain 只足汁算出丫最优 
值，并未给出最优解。也就是说，通过 ManixChain 的计算，我们只知逍要讣算所给的矩阵连乘 
积所需的最少数乘次数,还不知道具体应按什么次序来做矩阵乘法才能达到最少的数乘 次数， 
然而， MatrixChain 已记录了构造一个最优解所需要的全部信总。事实 \：. s _ i ][ j \ 中的数 
h 古诉我们计算矩阵链4 的最佳方式应在矩阵和之间断即最优的加括号丌 

式应为 U4[U])U [“ 1:/」）。因此，从记录的位息可知汁算 A[l:< 的最优加括 
号方式为（4[1 :s[l 〕[ 7i]])(i4[s[ 1 ][ n 而 A[1 :s: 1 :「 /t]_| 的最优加枯号方式为 

(A[hs[i]: s [l][n]]])(A[ s [l]U[lU] + 同理吋以确定 A[ s [ i::nl 

+ 1：^] 的最优加括 y 方 式在«1][^] + i ] u ] 处断汗……照此递推下太‘.最终可以确定 
A [\： n ] 的最优完全加括号方式，即构造出问题的一个最优解。 

下面的算法 Traceback 按算法 MaUixChain 计算出的断点矩阵 s 指示的加括号方式输出计 
% A [ 的最优计算次序。 


void Tracebiick(irit i, irU j，iriM 



if (i = = j) return; 
Traceback(i ， s[_i][j],s); 
Traceback(s[ij._j] + 1, j, s); 


coat < < "Multiply A "<< i <<%"<< s i] [jj; 
cout < < ^ and A " < < (sLij j'j + l) << f, y tf << j 


< < endl ; 


要输出 A [ 1 a ] 的最优计算次序只要调用 Traceback ( 即可。对于 h 面所举的例子, 
通过调用 Tracebadc ( l ，6, j ), 即可输出最优计算次序 (( i 4】（ i 4 2 4.,)〉((4 4 4 sM 6 ))。 


3.2 动态规划算法的基本要素 


从计算矩阵连乘积最优计算次序的动态规划算法 MJ 以看出，该算法的有效性依赖于问题 
本身所具有的两个重要 性质: 最优子结构性质和子问题重叠性质、从一般意义丄讲，问题所具 
有的这两个重要性质娃该问题可用动态规划算法求解的基本要素。这对 f 我们在设计求解具 
体问题的算法时，是否选择动态规划算法具有指导意义。下 W 我们着東讨论动态规划算法的这 
两个基本要素以及动态规划法的一个变形——备忘录方法。 

1,最优子结构 

设计动态规划算法的第1步通常是要刻画最优解的结构 c 当问题的最优解包含/其子问 
题的最优解时，称该问题具有最优子结构性质 S 问题的最优子结构性质提供了该问题可用动态 
规划算法求解的東嬰线索:： 

在矩阵连乘积最优计算次序问题中，我们注意到，若的最优完全加括号方式在 
4和 A +1 之间将矩阵链断开，则由此确定的子链 AiAfA 和^ + 1 ^ + 2 "_人的宂全加括4 
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方 式也最 优。 即该问题具行勗优子结构件质,、在分析该问题的最优子结构性质时，我们的方法 
具有普遍性。 f 九我们 假设由问题的最优解导出的其子问题的解不是最优的，然肟再设法说明 
在这个假设下可构造出一个比原问题最优解更好的解，从而导致矛盾。 

在动态规划算法中，问题的最优子结构性质使我们能够以 fl 底向上的方式递归地 从子问 
题的最优解逐步构造出整个问题的最优解。问时，它也使我们能在相对小的子问题空间屮考虑 
问题。例如，在矩阵连乘积最优计算次序问题中，？问题空问是输人的矩阵链的所有不同子链 
组成的。所有子链的个数为外 n 2 ), 因而子问题空 M 的规模为 0( n 2 ) o 

2. 重叠子问题 

可用动态规划算法求解的问题应具备的另一基本要素是子问题的承叠性质、在用递 W 算 
法自顶向下解此问题时，每次产生的子问题并不总是新问题，有些子问题被反复计算多次。动 
态规划算法正是利用 r 这种子问题的重叠性质，对每-•♦个子问题只解一次，而&将其解保存在 
一个表格中，当再次需要解此了•问题时，只是简单地用常数时间查看一下结果。通常，不同的子 
问题个数随输人问题的大小呈多项式增长。因此，用动态规划算法通常只斋要多项式时间，从 
而获得较高的解题效率。 

为了说明这••点，我们来看在计算矩阵连乘积最优计算次序时，利用递 IH 式直接计算 
A [ I ； y ] 的递归算法 RecuTMiitrixChain y 

• • • • - - J ••••• • • • • • • _ • 

int RecurMatnxCh £ iiii(mt i t int j ) 

I 

% 

if (i = = j ) return 0； 

int u = KecurMalnxChain ( i , i ) 

+ Re ^ urMatnxChain(i + 1， j ) 

+ p[i - 1 ] * p[il * pij ] i 

s [ i ][ j ] = i ； 

for (int k = i + 1; k < j ; k + + ) j 
int t = Rtt ^ urMatrixChaiii ( i A k ) 

+ Re ^ virMttUixCliftin(k + \ ij ) 

+ p[i - l ] * p[kj * p [ j ]; 
if (t < u ) ! 
u = L ； 

& [ iilj ] = k；i 

I 

r 

return «; 

I 

I 

I 

% »參_馨看馨 • • • • 

用算法 Recur Matrix Chain ( 】， 4) 汁算 4[1 :4] 的递归树如图 3 -2 所小 。从 该图可以看出，许 
多子问题被重复计算 - 

事实 h ， 可以证明该算法的计算时间 r ( n ) 有指数下界。设算法中判断语句和赋值语句花 
费常数时间，则由算法的递 P 部分可得关于 T ( a ) 的递归不等式 如下： 

、 J 0 ⑴ 

T ^ ll + Tj ( T ( k ) + T{n ^ i ) 4- 1) ^ > 1 

4=1 

因此，当《 > 1时， 
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W 3-2 汁筲的递 If ! 树 

•\ -1 n -1 n — I 

Tin) ^ 1 + ( 7i - 0 + 2 T(k) + T(n - k) = n + 2^] T(k) 

k = 1 i= 1 JU • 

据此，可用数学 P 纳法证明 T ( n ) ^ 2 n ~ l = n ( 2 n ), 

因此，直接递! U 算法 RecurMatrixChain 的计算时间随 u 指数增长 ：相比 之下.解冋一问题 
的动态规划算法 MatrixChain 只需计算时间 0(^)。其冇效性就在 f 它 充分利用了问题的子 
问题重叠性质。不同的子问题个数为外一），而动态规划算法对1每个不同的子问题只 计算一 
次，从而减少了人量不必要的 U 算。由此也可看出，在解某一问题的直接递归算法所产生的递 
归树巾，相同的子问题反复出现，并且不同子问题的个数乂相对较少时，用动态规划算法足有 
效的. 

3. 备忘录方法 

动态规划算法的一个变形是备忘录方法。备忘录方法也用一 t 表格来保存已解决的子问 
题的答案，在下次需要解此？问题时，只要简单地查看该子问题的解答，而不必重新计算、与动 
态规划算法不同的是，备忘录方法的递!方式是自顶向下的，而动态规划算法则是底向上递 
归的。因此，备忘录方法的控制结构与直接递归方法的控制结构相冋，区別在下备 忘录方 法为 
每个解过的子问题建立了备忘录以备需要时查看，避免了相同子问题的重复求解。 

备忘录方法为每个子问题建立-个记录项，初始化时，该记录项存入一个特殊的值，表示 
该子问题尚未求解。在求解过程屮，对每个待求的子问题，首先丧看其相应的记录项。若记录项 
中存储的是初始化时存入的特殊值，则表示该子问题是第一次遇到，则此时计算出该子问题的 
解，并保存在其相应的记录项中。若 C 录项中存储的已不是初始化时存入的特殊值，则表示该 
子问题已被计算过，其相应的 E 录项屮存储的是该子问题的解答此时，只要从 C 录项中取出 
该子问题的解答即可。 

下向的算法 MemoizedMatrixChain 是解矩阵连乘积最优计算次序问题的备忘录方法。 

- ， • • • 禱 _ 參 

int Memoized Matrix Chain (int n，im 冷 * m，int * ^ s ) 

\ 

for (inf i = J ; i < 二 n; i 士 + 
for (int j = i ; j < = n ; j 4 

m . iJlj ] = 0； 
relurn LookupChniii( 1. n )； 
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ini LookupCkain(inl i> int j ) 


if (mLiJLjJ > return mLiJ.jJi 

if (i - = j ) return 0; 
ini u - LookupChain ( iJ ) 

+ LookupChain(i + l ， j ) 

+ p[i - 1J * pLiJ * p[j. i 

s[i][j] = i ； 

for (int k = i + l ; k < j ; k + + )i 
in " = LookupChain ( i . k ) 

+ LookupChainlk + 1 ， j ) 

+ pLi ~ 1] ， p[k] * p[j]; 
if (t < u ) I 

Q - U 

sLiJLj ] = k ; I 

I 

f 

m [ i ][ j ] = u ; 
return ui 

J • 

，者 -•• ，• , , - • • k J • . 

与动态规划算法 MatrixChain 一样，备忘录算法 MemoizedMalrixChain 用数组 m 来记录子 
问题的最优值。 ni 初始化为0,表示相应的子问题还未被计算。在调用 LookupChain 时，若 

> 0 , 则表示其中存储的是所要求子问题的计算结果，直接返回此结果即可。否则与 
； S 接递归算法一样， A 顶向下地递归计算，并将计算结果存入后返回。因此， 
LookupChain 总能返回止确的值，但仅在它第一次被调用时 H 算， 以后的调用就直接返回计算 

结果。 

与动态规划算法一样，备忘录算法 MemoizedMatrixChain 耗时事实上，共有 
0U 2 ) 个备忘记录项(][/]，（ = I, •••，《;) = …，％这些记录项的初始化耗费 0U 2 ) 时 
间。每个记录项只填人一次。每次填人时，不包括填入其他记录项的时间，共耗费 0(/l ) 时间 ° 
因此， UokupChain 填入 0U 2 ) 个记录项总共耗费 0( 一）计算时间 。由此 可见，通过使用备忘 

录技术，直接递归算法的计算时间从降至 O ( n ^), 

综上所述，矩阵连乘积的最优计算次序问题可用自顶向下的备忘录算法或自底向上的动 
态规划算法在 0( » 3 )计算时间内求解。这两个算法都利用了子问题重叠性质。总共有 
个不同的子问题。对每个子问题，两种方法都只解一次，并记录答案。再次遇到该子问题时，简 

单地 取用已 得到的答案，节省了计算量，提高了算法的效率。 

一 般来讲，当一个问题的所有子问题都至少要解一次时，则用动态规划算法比用备忘录方 

法好。此时，动态规划算法没有任何多余 的计算 •还可利用其规则的表格存取方式，来减少在动 
态规划算法中的计算吋间和空间需求。当子问题空间中的部分子问题…不必求解时，用备忘录 
方法则较有利，因为从其控制结构可以看出，该方法只解那些确实需要求解的子问题。 

3.3 最长公共子序列 

一个给定序列的子序列是在该序列中删去若十元索后得到的序列。确切地说，若给定序列 
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X = 丨 x 1 ， ：《 2 ， …， & 丨，则〉】- •序列 Z =丨 〜，，…，， 是的 f 1 序列 A 指杯孔 • •‘个严格递增 
K 标序列 \ l x , i 2 r -, i t ( \ 使得对于所行；=1，2, …』 有：~ ^ ;• 例如，序列 ' B y (：, D 9 B . 

是序列 A' = { A ^ BX . B . D . A . Bl 的沪序列，相应的递 增下# 序列为 1 2 J ,5，7匕 

给定两个 「f 列X和 i ， 当另- •序列 Z 既是尤 的子序列又是 F 的子序列时，称 Z 是序列 AT 
和 r 的公共子序列。 

例如，若 J = \ A 9 B , C 9 B . D . A , B\,Y = ! B ，/>, C ：，/ l,U 丨则序列 M ， C,Aj 是 Y 和 
y 的一个公共子序列，但它不足 J 和 V 的一个最长公共7序列。序列； B ， c \ u 丨也娃 \ r 和 
y 的一个公共子序列，它的度为4,时 a 它足; r 和 r 的一个最长公共子序列，因为 X 和 > 没 
有长度 X 于4的公共子序列。 

最长公共子序列问题:给定两个序列尤=…，; u 和 r = 1 71 ， >2 , —，^，找出 
a 和 r 的•个最长公共子序列。 

动态规划算法可有效地解此问题=下面我们按照动态规划算法设卟的步骤来设计一个有 
效算法二 


1. 最长公共子序列的结构 

解最长公共 T 序列问题的最容易想到的算法是穷举搜索法，即对 x 的所有子序列，检查 
它是否也是〗’的子序列，从而确定它是否为 叉和 r 的公共子序列。并且 在检查 过程中记录最 
长的公共子序列。 x 的所有子序列都检查过即可求出 x 和 f 的最长公共子序列。 x 的每个子 
序列相位于下标集 jl ，2,•••,/«! 的一个子集 。因此 ，共有个不同？序列，从而穷举搜索法需 
要指数时间」 

事实上，最长公共子序列问题具有最优子结构性质 D 

设 序列尤 = i , x 2 , …，、 丨和 r =丨: n ， j 2, …，3^1的一个最长公共子序列为 Z = \ z ]9 

以，…， ir 山则 

(1) 若= )/1，则4 =、= 且是 X m _ i 和的最长公共子序列。 

(2) ^ X m ^ y n ^ %，则 Z 是和 F 的最长公共子序列。 

(3) 若、_ y n 且 q _ %，则 Z 是义和 圮」的最长公共子序列。 

其中，= I ； y tt _] = Vc-l!；^^l = Ul ，22,…， a」 5。 

证^月 ：（〗） 用反证法。若 Zjfc # 贝彳丨 …， z k y X m 1 是义和 F 的长度为 & + 1 的公共 

子序列。这 是义和 r 的一个最氏公共子序列矛盾。因此，必有 y = X m = »由此吋知厶 
是义 m _i 和的一个於度为 - 1的公共子序列。若 h /和 有一个 k 度大于左 -1 的 
公共子序列酽，则将 .t m 加在其尾部产生 A 和 y 的一个长度大于4的公共子序列..此为矛盾、、 
故厶是和^的--个最长公共子序列。 

(2) 由于 F 的一个公共子庁列。若尤„^和 F 有一个长度大于的 
公共子序列 V ，则疋也是 X 和 F 的一个长度 大于& 的公共子序列。这与 Z 是1和 F 的一个 
最咬公共子序列矛盾。由此即知7是，和 K 的一个最长公共子序列。 

(3) 证明与 (2) 类似。 

h 述性质告诉我们，两个序列的最长公共子序列包含了这两个序列的前缀的最1<:公共 T 
序列。因此，最长公共子序列问题具有最优子结构性质。 

2. 子问题的递归结构 

由最长公共子序列问题的最优子结构性质可知，要找出 X = |^，_1 2 ,…， b ,; 和 
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Y - 丨 ，…， . r j 的最长公共子序列，可按以下方式递 W 地进行 ：当〜 = } n P 夂找出 

和的最 K 公丼子序列，然后在其尾部加上 x ,(= > Vi ) 即吋得 X 和 F 的一个 最长公共子序 
列^■当、尹；^时，必须解两个子问题，即找出 A 、.」 和 F 的一 个最长公共子序列及 A 和 
的一个最 K 公共子序列。这两个公共子序列屮较 K 者即为 A 和 y 的一个最长 公共子序列。 

由此递！ U 结构袢鉍看到 最氏公八子序 列问题 具有了 •问题1叠性质。例如，在计算 x 和 r 
的最长公共子序列时，可能要 n 算 x 和及和 f 的最长公共子序列。 fW 这两个子问 
题都包含一个公共子问题，即计算 ，和） V ,的最 K 公共子序列。 

与矩阵连乘积最优计算次序问题类似，我们来建立 P 问题最优值的递归关系。用 ch ][ y ] 
记录序列 A 和 I 的最长公共了•序列的长度。艽屮 ，, t = Ubh ， …，= bm , …， 
，/。当 （ = o^j =： 0时，空序列是 A 和 I 的最长公共子序列 3 故此时 c [ i ][ j ] = 0。其他情 

况下，由最优子结构性质可建立递归关系 如下： 

r0 i = 0, j = 0 

c [0[ y ] = I c [ i ’ - lj :> — 1] + 1 > 0； X S = r ； 

^max| c[ i][y 一 1] i - l][j.] j i，j > 0; x, ^ \j 

3. 计算最优值 

直接利用递归式容易写出一个计算 c [ i ]： j ] 的递归算法，但 艽计算 时间是随输人长度指 
数增长的。由于在所考虑的子问题空问屮，总 Jt 有外顯）个+同的子问题，因此，用动态规划 
算法自底向上计算最优值能提卨算法的效率。 

计算最长公共子序列长度的动态规划算法 [. CSUr ^ lh 以序列 Y =丨~，:^，…， 、丨和 

Y = bi ， y 2 ，…，作为输人，输出两个数组 c 和 b 。 其中 c [ i ][ J ] 存储尤和&的最长公共子 
序列的长度， bD ][ y ] 记录 cO ][>] 的值是由哪一个子问题的解得到的，这在构造最长公共子 
序列时要用到 J 可题的最优值，即 x 和 y 的最 K 公 Jlc 子序列的 K 度记录于 c [ m ][ M 中。 

a 拳拳拳 / 瓠 ■鳓 , iri 9 0 參 •瓤 k •鵞 _ m m m m m • • • • • • • • • • • • • 

void LCSI-ength(int m, int n，（，har * x,char int 关 x c. Type ^ b) 

Nnt i ， j; 

for (i = 1; i < = m ; i + + ) c [ i ][0] = 0; 
for (i = 1; i < = n ; i + +) c [0 j [ i ] = 0; 
for (i = 1; i < = m ; i + + ) 
for (j = 1; j < =： n ; j + + ) \ 

if (xLi] - - yLjJ )； 

cLiJLjj = c[i - lJlj 一 十 1; 

bLiJLjJ = " V ; 

else if (c[i - lJ!.jJ > - cLiJij - 1 j) i 
c[il[j] = cLi^ l][j]; 
b[i][j] = f 午 r ; 


Cli][j] = c[i][j- 1 ：； 
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由于每个数组单元的计算耗费0(】）时间，算法 LCSLength 耗时 

4. 构造最长公共子序列 


由算法 IXSkngth 计算得到的数组 b 可用于快速构造序列I = U,，；c 2 ，…，: c m i 和 y = 
in, r2 ，-，rJ 的最长公共子序列。首先从开始，沿着其中的箭头所指的方向&数 
组 b 中搜索。当在 b [ i ][ j ] 屮遇到时，表示 A 和& 的最按公共天序列是由和 ，的 
最长公共子序列在尾部加上\所得到的子序列3在 b:i」 [乃 中遇到 'i 时，表示和匕的 
最长公共子序列与和的最长公共子序列相同。当在 b [ z ][ ; _] 中遇到 '—’ 时,表示夂 
和的最长公共子序列与&和}的最长公共子序列相同。 

下面的算法 LCS 实现根据 b 的内容打印出夂和~的最长公共子序列。通过算法调用 
LCSim.n , x , b ) 便吋打印出序列义和7的最长公共子序列。 


void LCS( in( i % int j，char y x, Tvpe ,v ^ b) 


if (i - = 0 I I j = = 0) return; 

if = = r \ r ){ 

LCS(i- l,j - Ux.b )； 

cout < < x[i]; 

I 

I 

dse if (bii][j.== ' 个 ' ） LCb(i - 1 ， j t x,b); 
ftlse LCS(i,j - 1 y x T h); 

I 

\ 

I 

參 94 髒 • • • • • r • • • • • • • m • 

在算法 LCS 屮，每一次递归调用使 i 或」 • 减1，因此算法的计算时间为 0 (rn + n ) 0 
例如，设所给的2个序列为 A ： =丨.4,5,6\纪/>，^4，扪和}=： 由算 

法 LCSLenglh 和 LGS 计算出的结果如图 3-3 所示。 



& I 3-3 算法 LCS 的计算结果 
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5. 算法的改进 

对于一个具体问题，按照一般的算法设计策略设计出的算法，往往在算法的时间和空间需 
求上还有较大的改迸余地。通常可以利用具体问题的一找特殊性对算法作进一步改进。例如, 
在算法 LCSLength 和 LCS 中，可进…步将数组1>省去。#实上，数组元素 c [ (] [] 的值仅由 
c[i - i][y - i ]0] 和 - 1] 这三个数组元素的值所确定。对于给定的数组元 

素 <〖][/]，我们可以不借助于数组 b 而仅借助于^本身在 0(1) 吋间内确定 </][>] 的值是由 
- i ][ y - i ], c [ i - 1][/]和轧/][ ; _- 1] 中哪一个值所确定的。因此，我们可以写一个类似 
于 LCS 的算法，不用数组 b 而在 0( m + n ) 时间内构造最长公共子序列。从而 《 J 节省 9{ mn ) 
的空间。由于数组 c 仍需要外 ) 的空间，因此，在渐近的意义上，算法仍需要外 /7 m ) 的空间， 
所作的改进，只是对空间复杂性的常数因子的改进。 

另外，如果只需要计算最长公共子序列的长度，则算法的空间耑求可大大减少。事实上，在 
计算 <0][ y ] 时，只用到数组 c 的第 t 行和第纟-1行<；因此，用 W 行的数绀空间就可以计算出最 
长公共子序列的 K : 度。进一步的分析还可将空间需求减至 0( rnin ! m ， M ) c . 

3,4最大子段和 


给定由《个整数(吋能为负整数）组成的序 列…， 〜•♦•，&，求该序列形如的子段和 

k - i 

的最大值。当所有整数均为负整数时定义其最大子段和为0。依此定义，所求的最 _ 优值为 


max{()，max 




4 

例如，当(〜，《 2 ，《 3 ，《 4 ，《 5 ，《 6 ) = (_2，11， -4,13, -5, -2)时，最大子段和为 D 叫 


20 


. 最大子段和问题的简单算法 


对于最大子段和问题，有多种求解算法。我们先来 i 、 t 论一个简爷算法。其中用数组 a [] 存 
储给定的 n 个整数，…，〜。 

■ • \ V » •各沪 *• • 9 I • • • 參、^ m m m 

int MaxSum(int n, int * a y int& besti, int& 1 wstj) 

I 

intsum = 0; 

for (int i = 1 ;i < = ti;i + + ) 
foi (int j = i;j < = n;j + + ) I 

int ihissum = 0; 

for (int k = i;k < =： j;k + + ) thissum + = a[k]; 
if (thissum > yum) ! 
sum - thissum j 

= i; 

=： j ; 
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return sum; 




从这个算法的 3 个 for 循坏可以看出它所耑的计算时 N 是 ()[^) .亊实上，如果我们汴意 

5 (J E = a /+ iU ， 则可将算法中的最 )5 —个 for 循环畨上，避免重复计算.从而使算法得以 
改进!改进后的算法可描 述为： 

int MiixSurn(iat n, hit * a ， int& bcsti ， int& bcstj) 

i 

inlsuiri = 0; 

for (int i = l ;i < = n;l + + ); 
irit thissum = 0; 
for (ini j = i;j<^n;j+ + )< 

thissum + = a[j. : 

if (thissum > sum) i 
sum = Lhissurn; 

besti = i: 

beslj = j; 


relurn sum ； 

• • • • _ 

改进后的算法显然只需要 o ( 的计算时间 r 上述改进是在算法设计技巧上的-个改 
进，能充分利用已经得到的结果，避免重复计算,节省了计算时间。 

2. 最大子段和问题的分治算法 

针对最大子段和 这个具 体问题本身的结构，我们还可以从算法设计的策略 h 对卜_述 
0( n 2 ) 计算时间算法进行更进〜步的改进。从问题的解的结构可以看出，它适合于用分治法 
求解。 

如果将所给的序列 a [ i ：^] 分为长度相等的两段 a [ l : n /2] 和 a [ «/2 + 1 i / t ] ,分别求出这 
两段的最大子段和，则 a [ l : n ] 的最大子段和有二种 情形： 

(0 a[l 的最大子段和与 a [ l :»/ 2 ] 的最大子段和相同。 

(2) a [ 1 ： n ] 的最大子段和与 a ' n /2 + \ : n ] 的最大子段和相同。 

(3) a [ l : a ] 的最大了段和为 \ ^ i n / 2 , n /2 + I $ j < n 

t - 2 

(1) 和 (2) 这两种情形吋递归求得。对于情形 (3) ，容易看出 ， i «/2]勻 a [ a /2 + 1 ] 在最优 
子序列中。因此，我』口」以在 a [ 1: n /2]中计算出 Ji 1 = ma \ ^ J ] ，并在 s .[ n /2 + \: n ] 中计 

i^i^n/2 k = j 

算出 s 2 = max V ； dU ]。 则 si + d 即为出现情形 (3) 时的最优值。据此 町设计 出求最 

V2 十 fr=J 】 /2 •丨 

大子段和的分治算法 如下： 

• _ • 

int MaxSubSum(int ^ a, int left, int right) 


intsurn = 0 ; 
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if (leit = = right)sum > 0?al_k?ft_l :0; 

dse i 

int = (left + right )/2; 

int leftsum =： MaxSubSum (a ,left, center) ; 

int ri^htsum =： MaxSul)Suin(a,center + 1,right); 

ini si = Oj 

int lefts = 0 ； 

for (int i = chiller; i > - left;i — ) i 
lefts + = n[ij; 
if (lefts > si )sl = lefts ; 

int s2 = 0; 
int rights = 0; 

for {int i = (.-ertfir +!;)< = right;! + + ) i 

+ = i 丨； 

if {righls > »2)s2 = rights; 

I 

I 

sum = si + s2; 

if (sum < lcftsmn)suin - leftsum ； 
if (sum < rightsum)sum = rightsum; 

i 

I 

return sum; 


int MaxSum(jnt n , int ^ a ) 


return MaxSubSum ( a ，1， n ) 


该算法所需的计算时间 T ( n ) 满足典型的分治算法递归式 


T ( n ) 


■ 0 ( 1 ) 

.2 7 (^/ 2 ) + O(n) 


n ^ c 
n > c 


解此递归方程可知， TU ) = O ( nhgn ) 

3. 最大子段和问题的动态规划算法 


在对上述分治算法的分析屮我们注意到，若 iCK >] = n ^ x { 2 ^ a [ k]} f l 






求的最大子段和为 


max 7 , a \_ k ] = max max /_^ a [ k ] - max 6[ y ] 

由 Kry ] 的定义易知，当 b[j - 1] > 0 时 6[ y ] = b[j ^ a [ j ], 否则 
此町得计算 b [ j ] 的动态规划递! U 式 

b [ j ] = max \ b[j - 1 ] + 〆 厂，， 1 ^ j ^ n 

据此，可设 i 卜出求最大了 段和的 动态规划算法如下： 
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int MaxSuin(int n , int ^ a ) 

I 

I 

intsum - 0. 

b = 0; 

for (int i = 1 ;i < - n;i + + ) } 

if (b > 0) b + = a [_ ij ; 

else b = a [ i ]； 

if ( I ) > sam)suni = b ; 

參 

馨 

return sum; 

I 

I 

上述算法显然需要 0( n ) 计算时间和 OU ) 空间。 


4. 最大子段和问题与动态规划算法的推广 


最大子段和问题可以很自然地推广到高维的情形。 

(1) 最大子矩阵和问 题:给 定一个 爪行《列的整数矩阵 A ，试求矩阵4的 ‘个 子矩阵，使 
其各元素之和为最大。 

最大子矩阵和问题是最大子段和问题向二维的推广。用二维数组 a [ l ： m j L _ l ： d 表示给定 


的爪行^列的整数矩阵。子数组 a [ il ： i 2][ yl ： j 2] 表示左上角和右下角行列坐标分别为⑺， 
yi ) 和< i 2， j 2) 的子矩阵，其各元素之和记为 


il , 12, jl 、 j2) 




[0[ y ] 


最大子矩阵和问题的最优值为 max s ( 11,12, jU j 2) 0 

1 € 【 I € m 


如果用直接枚举的方法解最大子矩阵和问题，需要 0( m 2 n 2 ) 时间 c 注意到 

max = max \ max s(i \ 7 i 2 y j 1 ^ j 2) \ - max t(i \ , 12) 

]^ ^ i2^ m 1 ^ 11 ^ i2^ m 1 e ： il a2^ n 1 ^ ^ i2^ m 


其中， ,（ il “2) 二 max f 1 ， i 2,/ I ， /2) 


max 


j = jl i = i\ 



设 6[ y ] = 2 山] [ j ] ，则 “ m ) = max S 

容易看出，这正是一维情形的最大子段和问题。由 ; A ， 借助于最大子段和问题的动态规划 
算法 MaxSum ， 可设计出解最大子矩阵和问题的动态规划算法 MaxSum 2 如下： 


int MaxSum 2 (int m，int n，int ^ ^ a ) 
intsum = 0； 

int * b = new int L n 十 1 j ; 
for (int i =： l;i < = in;i + + ) 1 

for (int k - 1 ;k < - n;k + + ) b [ k ] = 0; 
for (int j r i;j < = m;j + + ) i 

for (ini k - 1 ;k < - ii;k + + ) bLk ] + - aLj ][ k .; 
int max = MaxSum ( ji , b ); 
if (max > sum)Sum = max; 
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return sum ； 


由于解最大子段和问题的动态规划算法 MaxSum 需要 0( n ) 时间,故算法 MaxSum 2 的双 
重 for 循环需要 0( 计算时间。从而算法 MaxSurn 2 需要 0( 爪、）计算时间。特别地，当 

m = 0( n ) 时，算法 MaxSum 2 需要 0( n 3 ) 计算时间。 

(2) 最大 m 子段和问题:给定由〃个整数(可能为负整数）组成的序列 rtl ， a 2 ，…，，以及 
一个正整数/«，要求确定序列，…，&的 m 个不相交子段，使这 m 个子段的总和达到最 
大。 

最大 m 子段和问题是最大子段和问题在子段个数上的推广。换句话说，最大子段和问题 
是最大 m 子段和问题当 m = 1时的特殊情形。 

设 b (“ j ) 表示数组 a 的前』项中纟个子段和的最大值,且第/个子段含 a [ j ](\^ i ^ m y 
幻。则所求的最优值显然为 max 6(/7^)。与最大子段和问题类似地，计算 6((， y ) 的 

递归式为 


b ( i 9 j ) - max | 6 { i , j - 1) + a [ j] f max . b(i - \ ^ l ) + a [ j ]\ (l ^ i ^ ^ j ^ n ) 

其中， 6((，）-〗）+ a [ j ] 项表示第 i 个子段含 a[j - !]， 而 max 6 (i - l ， t ) 十 a [ j ] 项表示第 

i- 1 ^ t<j 

i * 个子段仅含 a [/]。 初始时， 6(0，）） 二 0,(1 ^ j ^ n );6( i ,0) = 0,(1 ^ i ^ m ) 0 

根据上述计算 b ( i ， j ) 的动态规划递归式，可设计解最大 m 子段和问题的动态规划算法 
如下： 

•w* •• ^ r j • ■ • • • ^ j • • • j • • • • • •s • • •••••••• % % ^ •• ， J ' J • • * * •*• • • r • • • « r r • r • 

int MaxSum(int m，int n，int * a) 

J 

I 

if (n < m I i m < 1) return 0; 
int * * b = new int * [m + 1]; 
for (int i = 0; i < = m ; i + + ) 
b [ i ] = new int [n + l ]; 
for (int j = 0; i < = m ; i + +) b [ i ][0] = 0; 
for (int j = l ; j < = n ; j + + ) b [0 j [ j ] - 0; 
for (int i = 1 ;i < = m;i + + ) 

for (int j = i；j < = n - m + i;j + + ) 

if (j > i) 1 

b[i][j] = b[i][j^l] + a[j]; 
for (int k = i - 1 ;k < j;k + +) 
if (b[i][jj < b[i - l][k] + a[j]) 
b[i][j] = b[i - l][k] + a[j]; 


else b[i][j] = b[i - l]「j - l] + a[jJi 
int sum = 0; 


for (int j = m;j < = n;j + + ) 
if (sum < b[m]jj]) sum - 


bLm ][ j]i 
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return sum; 



intsum = 0; 

for (int j ^ in;j < - n;j + +) 
if (sum < b[jj)sum = b.jl i 
return sum; 

I 

I 

瓤蠢蠢 ■_ 參， '馨 • • • ^ % I % ••• • • ••• ■馨 __ _ _ i_j __ • 奢 

上述算法需要 0[ m(n - m )) 计算时间和 0 U ) 空间。当 m 或 m 为常数时,上述算 
法需要 0(b) 计算时间和 0( n ) 空间。 

3.5 凸多边形最优三角剖分 

用动态规划算法能有效地解凸多边形的最优三角剖分问题。尽管这是一个几何问题，但在 
本质上它与矩阵连乘积的最优计算次序问题极为相似。 

多边形是平面上一条分段线性闭曲线。也就是说，多边形是由一系列首尾相接的直线段所 
组成的。组成多边形的各直线段称为该多边形的边。连接多边形相继两条边的点称为多边形的 
顶点。若多边形的边除了连接顶点外没有别的交点，则称该多边形为一简单多边形 。一 个简单 
多边形将平面分为三个部 分:被 包围在多边形内的所有点构成了多边形的内部;多边形本身构 
成多边形的 边界; 而平面上其余包围着多边形的点构成了多边形的外部。当一个简单多边形及 
其内部构成一个闭凸集时，称该简单多边形为一凸多边形。即凸多边形边界上或内部的任意两 
点所连成的直线段上所有点均在凸多边形的内部或边界 h 。 

通常，用多边形顶点的逆时针序列来表示一个凸多边形，即 P = ;〃0，~，〜，1^^丨表示具 
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匕述算法显然需要计算时间和 0( mn ) 空间。 

注意到在上述算法中，计算 !>[/:；![/] 时只用到数组 b 的第/ - 1行和第4了的值。因而算法 
中只要存储数组的当前行，不必存储整个数组。外一方面，，1，0的值可以在汁算 

第/ - !行时预先计算并保存起来。这样一来，在计算第纟行不必重新计算，节省了汁算 

时间和空间。按此思想可对上述算法作进一步改进如下. • 

• • • • 

int MaxSurn(int m , int n , ini ^ a ) 

I 

if (【i < mil m < 1 ) return 0; 
int * 1> = new int [ n + 1 ]; 
int * c - new int [n + 1 」； 

bLo] = 0; 

c[l" - 0; 

for {int i = l;i < = m;i -(• + ); 

= Itf i - ! ] + a [ i ]; 

cLi - 1] = b[ij; 

int max = b ‘ i ]; 

for (ini j - i + i；j < = i + n - m;j + + )1 

bLj : = b[j - 1」 > - l ]? b[j - 1 ] + a[jj ： c[j - \ ] + a [ jj ; 

cLj - 1] ; max; 

if (max < b [ j ]) max = b [ j ]; 




省条边 M tj ， a r 2 , …，丨。，的一个凸多边形。其中,约定 

若 zu 与&是多边形上不相邻的两个顶点，则线段•称为多边形的一条弦。弦〃巧将多 
边形分割成两个多边形 i h，?; i+ i ，…，~ i 和， ~ + i ，…， hU 

多边形的二角剖分是一个将多边形分割成 江 不相交的三角形的弦的集合7‘。图 3-4 是- 
个 h 7边形的两个+同的:-:角剖分。 




m 3-4 一个凸7边形的两个不同的二角剖分 

在凸多边形 P 的•-个三角剖分 r 中，各弦互不相交， R 集合： T 已达到最大，即 P 的任一不 
在 r 中的弦必与 F 中某一弦相交。在一个有〃个顶点的凸多边形的三角剖分屮，恰有 n -3 条 
弦和 n -2 个三角形。 

凸多边形最优二角剖分问题 :给定 一个凸多边形 P =丨^^^…^^^“以及定义在由凸 
多边形的边和弦组成的二角形 h 的权函数要求确定该凸多边形的一个二角剖分，使得该 
三角剖分中诸三角形上权之和为最小。 

可以定义三角形上各种各样的权函数 UJ 。 例如： = | 丨 + 丨 ！；yh 丨+ | 丨 ，其 
中，丨 l ^ V 丨是点^ 到％ 的欧氏距离。相应于此权函数的最优三角剖分即为最小弦长三角剖分。 
本节所述算法可适用于仟意权函数。 

1 .三角剖分的结构及其相关问题 

凸多边形的三角剖分与表达式的完全加括号方式之间具有十分紧密的联系。正如所看到 
的,矩阵连乘积的最优计算次序问题等价于矩阵链的最优完全加括号方式。这些问题之间的相 
关性可从它们所对应的完全二叉树的问构性看出。 

一个表达式的完全加括号方式相应于一棵完全二叉树，称为表达式的语法树。例如，完全 
加括号的矩阵连乘积 (( AjAMjKA ^ A ^ d )) 所相应的语法树如图 3*5( a ) 所示。 

语法树中每一个叶结点表示表达式中一个原子。在语法树中，若一结点有一个表示表达式 
E t 的左子树，以及一个表示表达式心的右子树,则以该结点为根的子树表示表达式（芯 〆 ,）。 

因此，有〃个原子的完全加括号表达式 Xf 应于惟一的一棵有 n 个叶结点的语法树，反之亦然。 
凸多边形…，&的三角剖分也町以用语法树来表示。例如，图3 -5( a ) 中凸多边 

形的三角剖分可用图 33( b ) 所示的语法树来表示。该语法树的根结点为边 t ， o V6 。二角剖分中 
的弦组成其余的内结点。多边形中除边外的各边都是语法树的一个叶结点。树根是 
三角形 v 0 v 3 v 6 的一条边。该二角形将原凸多边形分为三个 部分： H 角形 Mhh ， 凸多边形 
{ V 0 , V ], 1? 3 1和凸多边形丨以，…，,三角形的另外两条边，即弦和 

t »3^6 为根的两个儿子。以它们为根的子树 表示凸 多边形 U Q ， h ， …， V 31 1 和 j 以，…，的 

三角剖分。 
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⑷ 




( b ) 




图 >5表达式语法树与二角剖分的对应 

在一般情况下，•-个凸 n 边形的_角剖分对应于一棵有 n - 1个叶结点的语法树。反之，也 
可根据一棵冇 n - 1个叶结点的语法树产生一个相应的凸 n 边形的三角剖分。也就是说，凸 n 
边形的三角剖分与有 n - 1个叶结点的语法树之间存在 一一 对应关系。由于〃个矩阵的完全加 
括号乘积与《个叶结点的语法树之间存在 一一 对应关系，因此，《个矩阵的完全加括^乘积也 
与凸 U + 1) 边形中的二角剖分之间#在一一对应关系。图 3-5 的 ( a ) 和 ( b ) 表亦出了这种对应 
关系。矩阵连乘积 A ; Ay 中的每个矩阵卑对应于凸 （n + 1) 边形中的-条边三角 
剖分中的一条弦 v -. Vj . i < ) ，对应于矩阵连乘积 i + 1 :/ ]o 

事实上，矩阵连乘积的最优计算次序问题是凸多边形最优三角剖分 N 题的一个特殊情形。 
对于给定的矩阵链定义一个与之相应的凸 u + 1) 边形 p 使 

得矩 阵七与 凸多边形的边 —一 对应。若矩阵禹的维数为 PMX 二[，2，一〃，则定 

义三角形上的权函数值为 ： 仿（¥ ; %) = /^外。 依此权函数的定义，凸多边形尸的最优 
三角剖分所对应的语法树给出矩阵链 A J A 2 的最优完全加括号方式。 

2. 最优子结构性质 

凸多边形的最优三角剖分问题有最优子结构性质。 

事实上，若凸 （《 + 】）边形 P = hm ， 的一个最优二角剖分 7* 包含三角形 
j 1 < - 1,则 f 的权为三个部分权的和:三角形 v ^ v k v n 的权，子多边形 Un ^ l ， 

…，^丨和 I n ， h +1 ^!的权之和:，可以断言，由 r 所确定的这两个子多边形的三角剖分也 
是最优的。因为若有 Uo，iM ， …，或 u A ，n +1 ，…，的更小权的: T: 角剖分将导致 r 灭是最 
优三角剖分的矛盾。 

3. 最优三角剖分的递归结构 

首先，定义^1 ^ i < j 今 n 为凸子多边形丨 Vi .] , 的最优三角剖分所对 

应的权函数值，即其最优值。为方便起见，设退化的多边形 W 有权值0。据此定义，要 
计算的凸 U + 1) 边形 P 的最优权值为 r [ l ] U ].. . 

，[〖]〔人1的以利用最优子结构性质递归地计算。由于退化的两顶点多边形的权值为 
0,所以 r : i ][ Z ] = 0, i = 1，2, …， ri 。 当 - € 备1时，凸子多边形| , I ；, •…，~ 丨至少有3 t " 

顶点。由最优子结构性质，心 ][_/] 的值应为的值加上 /[A + !][/] 的值，再加上三角 
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形的权值，其中，； ^ k ^ j - 1。由于在计算时还不知道 A 的确切位置，而 A 的所有可 
能位置只有 y - ^个，因此可以在这/ - i 个位置中选出使 z j][y] 值达到最小的位置。由此， 
【[€][/]可递归地定义为 




0 

min I i ][/:] + t[k + l ][/] 

i^k<j / 


+ V k Vj) \ 



4. 计算最优值 


与矩阵连乘积问题中计算 m [ i ][ j ] 的递！ li 式进行比较容易看出，除了权函数的定义外， 
/[ i ][ y ] 与的递！ H 式是完仝一样的。因此只要对汁算的算法 MatrixChain 
作很小的修改就完全适用于计算 t [ i ][ j ] 0 

下面描述的计算凸 U + 1) 边形 P == U ’ oJi ，…，的最优三角剖分的动态规划算法 
MinWeightTriangulation 以凸多边形 P = ! v 0 , q ，…，、|和定义在二角形上的权函数《;作为 
输入。 

template < dass Type > 

void Min Weigh tT riangulation (int n, Type * 爷 t，int * * s) 

I ^ 

I 

for (int i = 1; i < = : n; i + + ) t[i][i] = 0; 
for (int r=r2;r<=n;r+ + ) 

for (int i = 1; i < = n - r + 1; i + + ) | 
int j = i + r - 1; 

tLi][j] = t[i + l]-j] + w(i - l,i,j); 

s[i][j] = i ； 

for (int k = i+ l;k<i + r- l;k+ + )j 

w 

int u = t[i][k] + t[k + l]LjJ + w(i - l ， k,j); 

if (u < t[i][j]) S 

t[i][j] = u; 
s[i][j] = k ； ! 


与算法 MatrixChain —样，算法 M in Wei ght T riangulat ion 占用 0( n 2 ) 空间，耗时 0 ( n 3 ) o 

5, 构造最优三角剖分 


算法 MinWeightTrianginatkm 在计算每一个凸子多边形丨心小〜，…， V 的最优值时，用 
数组 s 记录了最优三角剖分中所有三角形信息。 s _「 i ][ ; ] 记录了与〜和^ 一起构成三角形的 
第3个顶点的位置 D 据此，用 0 ( ri ) 时间就可构造出最优 H 角剖分中的所有二角形。 

3.6 多边形游戏 


多边形游戏问题是1998年国际信息学奥林匹克竞赛试题。 

多边形游戏是一个单入玩的游戏，开始时有一个由《个顶点构成的多边形。每个顶点被赋 
予一个整数值，每条边被赋了，一个运算符“ + ”或“ * '所右边依次用整数从1到 a 编号。 
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游戏第 i 步，将一条边删除。 

随后 n - 1步按以下方式操作， • 

(1) 选择一条边^以及由 A； 连接着的2个顶点 V 1 和 V 2; 

(2) 用一个新的顶点取代边£以及由£连接着的2个顶点 t_l 和 将由顶点和 

的整数值通过边£ t 的运算得到的结果赋予新顶点。 

最后，所有边都被删除，游戏结束。游戏的得分就是所剩顶点上的整数值。 

编程 任务: 对于给定的多边形,编程计算出最髙得分，并&列出所有得到这个最高得分首 
次被删除的边的编号。 

数据 输入: 由文件 POLYGON. IN 提供输人数据，文件的第一行是所给多边形的顶点数 
M 第2行包含所有边1到〃所对应的运算符，以及与相邻两边相关联的顶点的数值 (1 马边与 
2号边之间是1号顶点的数值，2号边与3号边之间是2号顶点的数值，…，依此类推。最后的一 
个数值对应于与 n 号边和I号边相关联的顶点)。运算符与数值之间由一个空格分隔 。字母 t 
代表运算符“ + ”，字母: r 代表运算符“* ”。文件名由键盘输入。 

结果输出：程序运行结束时,将计算结果写人文件 POLYGON.OUT 中。文件的第 i 行是 
计算出的最卨得分。第2行是所有得到这个最髙得分首次被删除的边按升序排列的编号。 
输人文件示例 输出文件示例 

POLYGON. IN POLYGON. OUT 

4 33 


t - 7 t 4 x 2 a 5 12 

该问题与上一节中讨论过的 A 多边形最优三角剖分问题类似，似二者的最优子结构性质 
不同。多边形游戏问题的最优子结构性质更具有一般性。 


1. 最优子结构性质 


设所给的多边形的顶点和边的顺时针序列为 

op[l] ， 1^1]，op[2]，t [2] ，…， op[ n]，!；[ a] 

其中， oph] 表示第 f 条边所相应的运算符,〃[纟]表示第 / 个顶点上的数值 ，（ =1 ^ n , 

在所给多边形中，从顶点 i(l< /矣幻开始，长度为 y (链中有 ; •个顶点）的顺时针链 pU， 
j ) 可表示为 


f],op[ ^ + 1]， …，。 [Z + /’ - 1]. 

如果这条链的最后一次合并运算在 op[t+ ,] 处发生 ( 1 ^ y - 1 ) ，则可在 op[ / 4 S ] 处 

将链分割为两个子链幻和 - 0。 

设 ml 是对子链 p ( i , s ) 的任意一种合并方式得到的值，而 a 和心分别是在所有可能的合 
并中得到的最小值和最大值。 W 是 P (“s ， 卜 ) 的任意一种合并方式得到的值，而 c 和 d 分 
别是在所有可能的合并中得到的最小值和最大值。依此定义我们有 

a ^ ml 矣 b，c ( m2 ( d 

由于子链 P (i，d 和 P U + 的合并方式决定了〆£_，>)在 o P :i + >•] 处断幵后的 

合并方式，在 op[^ + ,]处合并后其值为 

m - ( ml)op[ i + $]( m2) 

(1) 当 opj + f 时，显然有 
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a + c ^ m ( h + (l 

换句话说,由链 〆 i , y ) 合并的最优性 Uj 推出子链 P ( k ) 和 〆 i + W _- s ) 的最优性，且 
最大值对应于子链的最大值，最小值对应于子链的最小值。 

(2) 当 op [/ + d ^时，情况有所不同。由 Ti ； [纟]可取负整数，子链的最大值相乘未必 

能得到主链的最大值。但是我们注意到最大值一定在边界点达到，即 

min \ ac ， ad ， kc ， bd\ ^ m ^ max! ac , ad , be t bd i 

换句话说，主链的最大值和最小值可由子链的最大值和最小值得到。例如，当 m = ac 时, 
最大主链由它的两条最小子链 组成； 同理当 m W 时，最大主链由它的两条最大子链组成。 
无论哪种情形发生，由主链的最优性均可推出子链的最优性。 

综上可知多边形游戏问题满足最优子结构性质。 

2. 递归求解 


由前面的分析可知，为了求链合并的最大值，必须同时求子链合并的最大值和最小值。因 
此在整个计算过程中，应同时计算最大值和最小值， 


设 m [ i ，），0] 是链 p ( i , j ) 合并的最小值，而 m [ i,j % \] 是最大值。若最优合并在 op[i ^ 
S ] 处将 〆 ；，/)分为 2 个长度小于^/的子链 〆 i ， 丨十 d 和 〆 / + 且从顶点 t ♦开始的 

长度小于 y 的子链的最大值和最小值均已计算出。为叙述方便，记 

d - m[i,i + s y 0] 9 b = mil + 5,1], c = + s y j - ,?,0], d = + $,j - a. ， 1L 

(1) 3 o p [“ 5 ] ， +' 时， 

"fit + C 

爪 [“j ， l] = b + d 

(2) 当 op [ i + s j : f f 时， 

tti [ i , 0 ] - min \ ac ^ ad y he ^ bd \ 
m[i - max ) a € , ad 9 be 9 bd > 

综合 (1) 和 (2)， 将在叩 [( + J 处断开的最大值记为 ma X f ( i ，），〃），最小值记为 

minf (“ j .， s )， 则 


minf( i 9 s) 


maxf( “ /， i ) 


a ^ c Op[ t. 十 4 ] 

min! ac ， ad ， be ， bd\ op[ i + 
b + d op[ i + 5 ] 

max \ ac y ad 9 be ^ bd\ op[ / + ] 




由于最优断开位置 $ 有 1 在 $ o -1 的 j -1 种情况，由此可知 

m[ i ， ) ， 0] = min I niinf( i, j, s) \ f l ^ i, j ^ i 

i = ss=ey 

二 max |maxf(I , 1 ^ i,j ^ i 


m 


初始边界值显然为 


* 


m[ 1,0] - i] 名 i ^ n 

m[1 1 1 ] = ^ n 

由于多边形是封闭的，在上面的计算中，当 i + s > n 时，顶点 i + 5 实际编号为 G + d 
mod n 。按上述递推式计算出的即为游戏皆次删去第/条边后得到的最大得分。 
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3. 算法描述 

基于以上卜 t 论可设计解多边形游戏问题的动态规划算法如下: 

• • • • • • • • • • • ^ m • • • 

void MIN_ MAX(int n，int i ， ints，int j ， in {& minf ， ini& maxO 

) 

int e[4]; 

int a = m[i] [s]'_0 」 ， 
b = m[i][s][l ], 
r - {i + s- 1 )%n + 1 f 
c = nur][j - s-[0], 
d = tn[r]{j - s][l]; 
if (op[r] = = V) { 

minf = a 4 c; 
maxf = b + d; 

! 

else 

e[ 1J - a * c; 
e[2] = a * d ； 
e[3l - b * c; 

e[4] = b * d» 

minf - e[l 
maxf - e[ i J; 

for (int r = 2;r < 5;r + + ) ^ 

if (minf > e[rj) minf = e[r]; 
if (maxf < e[rj) maxf - e[rj ； 


int Poly. Max (int n) 

) 

int minf , maxf ; 
for (int j = 2 ;j < = n;j + 十） 
for (int i = 1 ;i < - n;i -f + ) 
for (ints = l ; s < j ; s + + ) \ 

MIIS 二 MAX(n ， i ， a,j ， minf, maxf, m,op); 

if (m[i][j][0] > minf) ^ minf; 

if < maxf) = maxf ； 

I 

I 

int temp = m[ 1 ] [n] [l ]; 
for (int i = 2;i < = n;i -h +) 

if (temp < 1 ]) temp = m[i][n][] ]i 

return temp ； 
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4. 计算复杂性分析 

与凸多边形最优二角剖分问题类似， h 述算法需要 0 U 3 ) 计算时间。 


3.7 图像压缩 


在汁算机中常用像素点灰度值序列 I 以，/ > 2 ，…， 以丨表示图像。其中整数 p ， 1在；矣、表 
示像素点 Z 的灰度值。通常灰度值的范围是0 〜 255。因此,需要用8位表示一个像素。 

图像的变位压缩存储格式将所给的像素点序列，^2，…， pd 分割成爪个连续段心， 
S 2 ，…，心。第 Z 个像素段6\中（1在 k 肌），有/ ⑴ 个像素，且该段中每个像素都只用 6[ i ] 

位来表示。设纟 [ i ] = 在 i 在 m ， 则第 i 个像素段乂为 

k=l 

~ 丨+卜…， i: W[ i] I，1 在 i 在肌 

设 Ai = [\ og ( f max ^ p k + 1) 1, 则 心 ^ b [ i ] ^ 8。因此需要用 3 位来表示 b [ i ], 

\ ^ i ^ m 。 如果限制 1 矣 /[(] 矣 255, 则需要用 8 位来表示/ [0,1 ^ i ^ 的。这样一来，第 
f 个像素段所需的存储空间为/[氺6[《]+ 11位。因此，按此格式存储像素序列丨以，/> 2 , …， 

& I , 需要+ 11 m 位的存储空间。 

图像¥缩问题要求确定像素序列，…，的一个最优分段，使得依此分段所需的 
存储空间最少。其中,0矣 Pi ^ 256,1 ^ i < l 每个分段的长度不超过2%位 o 

1.最优子结构性质 

设/ [〖]，6[/]，1安 i 矣肌是!…，的一个最优分段 o 显而易见，/[!]，&[〗]是 
I P ) 的一个最优分段，且 l [ i ], b [ i ] y 2 i ^ w 是 | /)〖[1] + 1，“、/^的 — 个最优分 

段 3 P 图像压缩问题满足最优子结构性质。 


2. 递归计算最优值 

设， i ]， l 矣/矣 n 是像素序列 I / m ，…，的最优分段所需的存储位数。由最优子结构性 
质易知： 

5 [ I ] = min i 5 [ i - k] + k 关 b max( i - k + 1 > 0 1 +11 

1^ 々莓 min j i < 256 * 

其中， bmax( i t j) = I log( max I 外 ！ + 1)1 。 

据此可设计解图像压题的动态规划算法如下： 

^ ^ • ■ •暑 m • • w ^ • • s % •• • • • / • • • • • r • ^ • j r 气 ^ r ' 名 〆 1 • * ^ 各 ■■編 

void Cympress(int u, int p[ J ,int s[ J ， int l[_ ] ， int b[]) 

I 

Int Lmax - 256， header - 11; 
s[0] = 0; 

for (int i = l; i < - n; i + + ) | 
b[i] ^ length(p[i]); 
int brriax = b[i] i 
s[i」-sLi - 1J + bmax； 
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for (int j = 2; j < = \ & & \ 〈二 Litiax; j + +) ! 

if (bmHX < b[i - j + 1]) bmax = b[i - j + ij; 
if (sli] > sfi - jl + j ^ brnax)] 

s[ i] = - j] + j * bmax; 

l[i] = j; 


s[ij + - header; 


ini length(inl i ) 

I 

4 

I 

int k = l; 

i = i/2； 
while (i > 0 )) 
k + + ; 
i = i/2； 

l 

I 

return k; 


3. 构造最优解 

算法 Compress 中用仏 ]，b[ 纟]记录了最优分段所需的信息。最优分段的最—段的段长 
度和像素位数分別存储于1[〃]和1>[〃]中。其前一段的段长度和像素位数存储于1[71 -1:0] : 
和 b[n -l[n]] 中。依次类推，由算法计算出的1和 b 可在 0U) 时间内构造出相应的最优解 。 
具体算法可实现如下： 

_ « 鵞 __«\ • ^ ^ • • • • • 著碰 沪暑 . 奢沪， z 户产 • • • • • • • • • • • • J • • • • k 

void Traceback(int n T int& i ， ii】t s[]，int 1[]) 

I 

I 

if (n - - 0) return; 

Traceback(n - l^n] ， i ， s ， l); 
s[i + + ] = n - l[nj ; 


void Output(irU s: ] ， ini ]，int b」，int n 〉 

I 

cout < < "The optimal value is " < < s[nj < < endl; 
int m 0; 

TracebacKn, m ， s ， i); 

s[ ml - n; 

cout < < "Decompose into ” < < m < < " segments "< < enrll; 
for (int j - i;j < = m;j + + ) ^ 

/fj] = !Wj ]」； 
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hr j] = b[sLij J ； 


for ( \w[ j = 1 ;j < - rruj + + ) 

cout < < l r jj < < ' ' < < bLjJ < < end! 


4. 计算复杂性 

算法 Compress 显然只需0 ( n ) 空间，由于算法 Compress 中对 y 的循环次数+超这256,故 
对每 一 个确定的 / ， 可在 0(1) 时间内完成 min I 5 [ / - ) ] + ) * b max (i - y + 1 ， i ) i 的计 

1 ^ mini 

算。因此整个算法所需的计算时间为 0 U )。 

3,8 电路布线 


在一块电路板的上、下两端分别奋 n 个接线柱。根据电路设计，要求用导线（〖,；:（（））将上 
端接线柱 i 与下端接线柱 Wi ) 相连，如图 3-6 所示。其中 ,; r ( i),l $ z _ $ »是|1,2,…，糾的 
一 个排列。导线 （ i '，； r (()) 称为该电路板 h 的笫/ 条连线。对于任何1 < / < ?!，（，_/•两条连 

线相交的充分且必要条件是 ttU ) > n(fh 


1234 56 789 10 



1234 56789 10 


图 >6 电路布线实例 

在制作电路板时，要求将这〃条连线分布到若千个绝缘层上。在 N —层上的连线不相交。 
电路布线问题就是要确定将哪些连线安排在第一层上，使得该层上有尽可能多的连线。换句话 
说，该问题要求确定导线集 Nets = ^i^n\ 的最大不相交子集。 


1. 最优子结构性质 

15 iY ( i t y ) =： ； r I { t , n { t )) € Nets , / ^ l 9 n { t ) ^ j \， IV ( i ， j ) 的最大不相交子集为 
MNS(t,y),Size(i,y) = I MNS(i,；) l, 

(0 当 f = 1 时， 

, 、 ， 、 [0 j < ?T(1) 

MNS(( ^^ (1 ^ Mid ,,0))1 ⑴ 

( 2 ) 当纟 > 1 时， 

① rr ⑴。此时, 〈 ij ⑺）冬 / VU ，））。 故在这种情况下，; iVU - l ，；）， 从而， 

Size ( t ,y ) = Size ( i - 1 ， j ) 。 

® j 》 ? r (/): 此时， 

若(“兀 ( i )) 6 〜11^(“/)，贝!]对任意（“71：0))6 MNS (/, y )^ t < iKnit ) < 7 T (0。 否 
则， (^^(0) 与 （ i ， 兀⑴) 相交 e 在这种情况下， MNS (“/) - 以 0) 丨是 yv(i - 1， 
TT ( i ) - 1) 的一个最大不相交子集。否则子集 
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MNS(i - 1,^(0 - 1) Y\{i y K(i ))： Cs\(i.j) 

是比 MNS(^y) 电大的 N(i ， j) 的不相交 T 集。这与的定义相不历 

^ M_NSU W ) ，则对任意 G ， ?r(«)) 6 MNS(z,y),^/ < i 从而 MNSU_/) 

C A r C i - 1 ， y )。 因此， Size ( i 、 j) ( Size (z •- 1 ,j) 0 

另一方向， MNS(f - i ， j) Q N(i ， j )， 故又有 Sizet(i ， j) > Si 狀 U - 1 ， y ) ，从而 Size(【•，））= 
Size( i - “/)〔_ 

综上可知，电路布线问题满足最优子结构性质。 

2,递归计算最优值 


电路布线问题的最优值为 Size( n , ^ . 由该问题的最优子结构性质 知 : 
(1) 当纟 = 丨时， 


(2) 当《> 1时， 


Size( t ,y) 


0 


j < 7r(\) 

j ^ 兀⑴ 


Size( i ， j) 


Size( i - 1 ,y ) 

max I Size( i - 1 ,j), Size( i 


< z( i) 


? 7 r ( i ) — l ) + !• 


j ^ 几 （ i) 

据此可设汁解电路布线问题的动态规划算法如下 。其 中用二维数绗单元 S i Z e[ 〖 ][y ] 表示 
函数 Size(i,/) 的值。 


void MNS(ini Cf ] , int n, int x * size) 

I 

for (int j = 0; j < CL 1 ]; j + + ) 

si ^ UJ - uj ] = 0; 

for {int j = C_l」；j < = n; j + + ) 

siz^Ll.tj] - 1 ； 

for (int i = 2; i < n; i i- +)： 

= 0; j < 

size[i]LjJ = size[i - l ； ]j]; 

for (int j = C[i] ； j < = r】；j + + ) 

size[i]|"j, = ttiax(si 此 、 i 一 1 ]「j 】， sizeri 一 11 「 G[i」— 1 ^ + 1); 




size[n.]L _ ii] = max(sizern - I] 「 n] ， size[n - 1 ,[C[ - 1. + I); 


void Trac!eback(im C[ ], int ^ ^ size, int n, int NetP ， int&r rn) 

I 

ini j - n; 
rn = 0; 

fur (int i = n; i > 1; i --) 

if (i>ize[i][j] ! = size.i - lJLjJ) I 

Netf m + + 1 = i; 

j = c [ i ] ~ i ；! 

if (j > = C* ； l]) 
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3. 构造最优解 


根据算法 MNS 计算出值，容易由算法 Traceback 构造出最优解 MNSU ， a )。 
其中，用数组 Net [0： m - 1] 存储 MNSU ， n ) 中的 m 条连线。 

4 .计算复杂性 

算法 MNS 显然需要0(一）计算时间和 0( n 2 ) 空间 Jmceback 需要 0 U ) 计算时间。 

3.9 流水作业调度 

n 个作业 H ，2，…， d 要在由2台机器财,和 M 2 组成的流水线上完成加工。每个作业加工 
的顺序都是先在 M , 上加工，然后在上加工。仏和 M 2 加工作业/所需的时间分别为〜和 

〜流 水作业调度问题要求确定这 rt 个作业的最优加工顺序，使得从第一个作业在 
机器上幵始加工，到最后一个作业在机器 M 2 上加工完成所需的时间最少。 

从直观上我们知道 ，一 个最优调度应使机器没有空闲时间，且机器 M 2 的空闲时间最 
少。在一般情况下，机器 M 2 t 会有机器空闲和作业积压两种情况。 

设全部作业的集合为 /V = U ，2,…， M 。 S g / V 是/ V 的作业子集。在一般情况下，机器 M , 
开始加工 S 中作业时，机器 M 2 还在加工其他作业，要等时间 T 后汴可利用。将这种情况下完成 
S 中作业所需的最短时间记为 r ( S ， t )。 流水作业调度问题的最优值为 T ( N ，0 ) o 

1 . 最优子结构性质 

流水作业调度问题具有最优子结构性质。 

设 ； r 是所给 a 个流水作业的一个最优调度，它所需的加工时间为〜⑴+ r 。 其中， r 是在 
机器 M 2 的等待时间为~ ⑴ 时，安排作业 ; r (2)， …，; r ( n ) 所需的时间。 

记5 = A ，- 丨 ; r (!) l ， 则有 r = T ( S ， b 心 )(、 

事实上，由 r 的定义知 r 為 T ( s . b n(]) ) 0 ^ r > m 卜⑴） ，设 〆 是作业集 s 在机器 
m 2 的等待时间为心⑴情况下的一个最优调度。则 • ； r ( 1 ) , 〆 u ) ，…， 〆 U ) 是 yv 的一个调度， 
且该调度所需的时间为〜⑴+ r ( s , b ^ 0) ) < ^ (1) + r 。 这与 ； r 是 ; v 的一个最优调度矛盾 c 
故 r 名 r ( s , 心⑴）。从而 r = ⑴）。这就证明了流水作业调度问题具有最优子结构 

的性质 。 

參 

2. 递归计算最优值 

由流水作业调度问题的最优子结构性质可知， 

r (^,0) = min U + T(N _ 

推广到一般情形下便有 

7(5,0 = I a ； + T ( S - UI , ~ 十 max 1 1 - ( i iy 0 \) i 

其中 ， maxW - ^,0 i 这一项是由于在机器财 2 上，作业 f 须在 maxU ,^ i 时间之后才能开工。 
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因此，在机器 t : 完成作业〖之后，在机器上还需 

bi + max! f , a, i - a, = 6, + max I t - a l9 0\ 

时间才能完成对作业 / 的加丄。 

按照1：述递归式，可设计出解流水作业调度问题的动态规划算法。通过刈递归式的深入分 
析,算法还可进一步得到简化。 

3, 流水作业调度的 Johnson 法则 


设 7 T 是作业集 S 在机器 M 2 的等待时间为 f 时的任一最优阔度。若在这个调度中，安排在 
最前面的两个作业分别是〖和 y ， 即以 1) = iMi ) :知则由动态规划递归式川得 

r(S，£) = a, + T(S - U|,& + max \ t - a t ,0( ) = a f + + T(S - \ i y j \ ^t i} ) 

其中， 


t i} = bj + max I hi + max < t - a ； , 01 - a ; , 0 S 


=bj + hi - aj + max I max t - a ； , 01 ,0! , aj - b { i 
= bj + bi _ a 丨 -+ max I z — dj , aj — ‘， Of 




bj bi - Qj - + max | t, + a- - 


如果作业 i 和 y 满足 mini & ， ci ; 1 為 mini bj , I ，则称作业/和 / 满足 Johnson 不等式。 
如果作业纟和 ） 不满足 Johnson 不等式，则交换作业£和作业/的加丄顺序后，作业 i 和 j 满 


足 Johnson 不等式 o 


在作业集 S 当机器 M 2 的等待时间为 f 时的调度 7T 中，交换作业 i 和作业的加工顺序，得 
到作业集 S 的另一 调度 ; T '， 它所需的加工时间为 


r(S 9 t) = a ，+ a } + T{S - 

其中 ， tji = b } + bi _ % - a + max U ， 屮 + aj - h j ,aj\ c 

当作业 f 和 > /满足 Johnson 不等式 mini 6；, a ; | mini b-.a, [ 时，我们 4 

max I - bi , - a) I ( maxi — bj，_ a/\ 

从而 


由此可得 


+ cij + max I — bi ，一 dj \ ^ d ( -h <ij + max J — bj ， — （1‘\ 


因此对任意 f 有 


max 


! an + a ； - bi , ^ max | + a - b 


a 


j 


max I f+ Uj - b t , a x - [ ^ max \ t ,ai + - b J , a f \ 

从而，〜矣心。由此可见 r(s ， t) 矣 r(s t t) c 

换句话说，当作业〖和作业不满足 Johnson 不等式时，交换它们的加工顺序后，作业 I 和 
y 满足 johnson 不等式，且不增加加工时间。由此可知，对于流水作业调度问题，必存在一个最 
优调度 JT , 使得作业 7f(0 和 + 1) 满足 Johnson 不等式 

min| ^ min) K( Ui)j a^ {{ ) \ , \ ^ i ^ n - I 

称这样的调度 tt 为满足 Johnson 法则的调度： 

进一步还可以证明，调度 ; r 满足 Johnson 法则当且仅当对任意 i ; '有 

mini/i r (n i^(y) I ^ min! 6^( ; ), ft^/) : 

由此可知，任意两个满足 johnscm 法则的调度具有相 |H 】 的加 I 时间。从虹所有满足 johnson 
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法则的调度均为最优调度屋此，我们将流水作业_度问题转化为求满足 Johnson 法则的调度 
问题。 

4,算法描述 

从上面的分析可知，流水作业调度问题一定存在满足 Johnscm 法则的最优调度，且容易由 
下面的算法确定。 

流水作业调度问题的 Johnson 算法： 

( 1 ) 令 jV ] = i H I ， / V 2 = W I n 乂 ！； 

(2) 将乂中作业依^的非减序 排序; 将 / V 2 中作业依~的非增序 排序； 

(3) N , 中作业接义中作业构成满足 JohmKm 法则的最优调度。 

算法可具体实现 如下： 

• •一 • 、••_,••• • • •••••••'• • • • • • • • ^ \ •• ^ • 

int FlowShop(int n t int a > int b ， int c ) 

j 

class Jobtypei 
public : 

int operator < = (Jobtype a) const 
\Tetum ( key < = a.key); I 
int key ； 
int index; 
bool job; 


Jobtype 〜 d = new jobtype [n]; 
for (int i = 0; i < n; i + +) | 

d[i] .key =： a[i] > b[i] ? b[i] : a[i]; 
d[i].job - a[i] < = b[ij; 
d[i].index - i; 

I 

sort(d f n); 

intj = 0 ， k=n-l; 

for (int i = 0; i < n; i + +) | 

if (d[ij - job) clj + +j = dLi],index; 
else c[ k - - ] = d[i], index; 

! 

j = ai.c[0]]; 
k = j + b[c[0 ]]； 
for (int i=l;i<n;i+ + )l 
j + = a[c[i]]; 

k = j < k?k + b[c[ij] + b[c[i]] i 

I 

i 

delete d ； 
return k; 
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5. 计算复杂性分析 

算法 FbwShop 的主要计算时间花在对作业集的排序上；因此，在最坏情况下算法 
FbwShop 所需的 i 十算时间为 0(/ j 〗 ogn )。 所需的空间研然为 0 ( n )：, 

3.10 0-1 背包问题 

0_1 背包问题 :给定 ri 种物品和一背包。物品 t 的重量是％，其价值为背包的容暈为 c 。 
问应如何选择装人背包中的物品，使得装入背包中物品的总价值最大？ 

在选择装入背包的物品时，对每种物品〖只有两种选择，即装人背包或不装人背包。不能 
将物品 i 装人背包多次，也不能只装入部分的物品（。因此，该问题称为 0-1 背包问题。 

此问题的形式化描述是，给定 c > 0 ，W > 0 ，h > 0 A ^ n ， 要求找出一个71元 0-1 向 

n rr 

量（文卜 i 2 , …，〜）， h 6 i 0， li ，1 矣 i 矣 ra , 使得 D 1^：^达到最大 u 因此， 0-1 

背包问题是一个特殊的整数规划问题： 1_， 



S ^ 

^ i = ! 

jt f ^ 10,1 h 1 ^ i « 

1 . 最优子结构性质 

0-彳背包问题具有最优子结构性质 。设 (: n，；K 2 ，…，^)是所给 0-1 背包问题的一个最优解。 
则(:^，…，％)是下面相应子问题的一个最优解： 

n 

max 〉二 i\Xi 

_n 

f U 矣 c - w iyx 

G i0,11,2 ^ i ^ rt 

因若不然，设 U 2 ，…， &) 是 h 述子问题的一个最优解，而 (, …， h) 不是它的最优解。由 

n r\ n 

此可知 . 2 > X 印，且 tt’i Vi + ^ C 。 因此 

£ = 2 i ■= 2 i = 2 

rr n 

+ 2 v i z i > S v iyi 

i =1 
7} 

^ iri + XI w i z i ^ c 

这说明 ( yi ，a, …， 、） 是所给 o-i 背包问题个更优解，从而 （ >W2 ，…， >n ) 不是所给 0-1 
背包问题的最优解。此为矛盾。 

2. 递归关系 

设所给0 - 1背包问题的子问题 

n 

max ^ jV^Xk 
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说 kM 免 j 


ix h \0,) \ 9 i ^ k n 

的最优值为 m ( i ， j )， 即是背包容量为 y ， 可选择物品为 〖，i + l ， …， a 时 0-1 背包问题 
的最优值。由 0-1 背包问题的最优子结构性质，我们可以建立计算 m ( i ， j ) 的递归式 如下： 




m 


ax\ m(i ^ \ ,j) f m( i + i ， j ， w L ) + t^| j 咨災 i 


m 


(n ， j) 


rn 


v 


(“ 1，/) 


0 j < w t 




0 0 ^ / < M ； 


3. 算法描述 


基于以上讨论 Wid ^ i ^ n ) 为正整数时，用二维数组 m [][] 来存储 U ， y ) 的相应 
值，可设计解 0- 1背包问题的动态规划算法 Knapsack 如下： 

• _ • ^ • 馨、， • 參 • * • • 一 • •• • • 參 • • • • • • • •••••• •〆 ， r _ •，參 • • • •••••，• • • • •户 s〆 J -w* J • • 

template < class Type > 

void Knapsack (Type v ? rat int c, int n，Type ^ * m) 

\ 

iat jMax = nim(w[n] - l,c); 
for (int j = 0; j < = jMax; j + + ) 
m[n][j] = 0; 

for (int j = w[n]; j < : c; j + + ) 
m[n][j] - v[n ]； 


for (int i = q - 1; i > 1; i — ) \ 
jMax = min( w[i] - J ， c); 
for (int j = 0; j < = jMax; j + +) 

= m[i + l][j]; 

for (int j = w[i]; j < = c; j + + ) 
m[ij[j] = max(m[i + l][jj, 

mti + l][j — w[i]] + v[i]); 

i 

m[l][c] = m[2][c]; 


if (c > = w[l]) 

m[l 」 [ 。 ]=i 2 iax(m[l][c], m[2][c - w[ l]] + v[ 1 ]); 



template < class Type > 

void Tracebacki Type * * m，int w，int c, int n y int x ) 

f 

for (int i = 1; i < n; i + + ) 

if (m[i][cj = = mLi + l]l_cj) x|_i] = 0; 
else I x[i] = 1; 

c - = w[i]; i 

x[nj ^ (mLnj[c]) ? 1 : 0; 
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按 h 述算法 Knapsack 计算后， m:l ]〔 c ] 给出所要求的 0 -t 包问题的最优值。相成的最优 
解可由算法 Twehack 计算如下。如果 m [ l ][ c ] = m [2] [ c ] ，则 z ! = 0,否则;= U 当 ^ i - 0 
时，由继续构造最 优解当 i = 1时， ftlm [2][ c - 〜：继 续构造最优解。依此类推, 
可构造出相应的最优解 （ A ， x 2 ,' t ', x n ) 0 


4 . 计 算复杂性分析 

从计算 m ( i , y ) 的递归式容易看出， 卜述 算法 Knapsack 需要 O ( nc ) 计算时间，而 
Traceback 需要 0( n ) 计算时 N 。 

上述算法 Knapsack 行两个较明显的缺点。其一是算法要求所给物品的重量 
< i 矣 n ) 是整数。其次，当背包容量 c 很大时，算法需要的计算时间较多。例如，当 
c > 2 n 时，算法 Knapsack 需要 n 2 n ) 计算时间。 

事实上，注意到计算 m (; ，/)的递归式在变量）是连续变量,即背包容景为实数时仍成 V :， 
我们可以采用以下方法克服算法 Knapsack 的上述两个缺点。 

首先考察0_】背包问题的一个具体实例如下。 
n = 5, c = 1(), u ： — !2,2,6,5,4l，u = i6,3,5,4,6| c 


由计算 wU ，；） 的递归式，当丨 = 5时， 


(5 9 j ) 


(“/> 


6 

0 0 ^ < 4 

该函数是关于变量/的阶梯状函数。由 m ( i ， y ) 的递归式容易证明，在一般情况下，对每一 
个确定的 纟（1 <丨在 W ， 函数爪（/， ; ‘）是关于变量 y 的阶梯状单调不减函数 c 跳跃点是这一类 
函数的描述特征。如函数 m (5 t j ) 吋由其两个跳跃点(0,0)和(4,6)惟一确定。在一般情况下, 
函数由其全部跳跃点惟一确定。如图 3-7 所示。 

在变量/是连续变量的情况下，我们可以 
对每一个确定的 f ( l 在（矣 n ), 用一个表 
〆 /]来存储函数 m ( i ， j ) 的全部跳跃点。对 
每一 个确定的实数 y ， 可以通过查找表 p [ i ] 

来确定函数的值。 〆 ；]中全部跳跃 
魚依 j 的升序排列：由于函数 

是关于变量；的阶梯状单调不减函 

数，故 〆 t ] 中+部跳跃点的 rn ( i ， j ) 值也 S 图 3 ‘ 7 阶梯状单调不减函数 t7l{ifj) 及其脈点 
递增排列的。 


( A ， 


# 


J 


表 p [(] 可依计算 mU ，/) 的递归式递归地 由表/ >[丨+ 1]来计算，初始时 〆 /1 + 1] = i (0, 
0)|。事实上，函数 m ( i 9 j ) 是由函数 m(i + 1,)) 与函数+ 1% 〜作 max 运算得 
到的。因此，函数的令部跳跃点包含于函数肌 G + l , y ) 的跳跃点集 p[i + 1] 与函数 


id + It ； 
^ c 且 G 

ali + 1] 


i 的跳跃点集 


+ 


1] 的并集中。易知， + 1] 当且仅当 


f ,) e p[i + 1]。因此，容易由 〆 i + 确定跳跃点集 


+】 ] 如下： 




/>[ i + 1] ® ( 


i) = \(j ^ 


m 


( i > j ) + I ( j y m ( i , j )) G p [ i + 


另一方面，设和 Ud ) 是 〆 t +〗]U (/D + 1] 中的两个跳跃点，则当 c 
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d < 6 时， U , 幻受控于 U 八） ，从而 ( cd ) 不是 〆 i ] 中的跳跃点。除受控跳跃点外， + lj 
U ^[ i-f 1] 中的其他跳跃点均为 pli ] 中的跳跃点。由此吋见，在递归地 由表 ; >u + 1] 汁算表 
p [ i ] 时，可先由 p[i + I ] 计算出+ 1]，然后合并表/>[〖+ 1] 和表以纟+ 1]，并清除其中 
的受控跳跃点得到表 

对于 h 面的例子，初始时 ； J [ 6 ] = !(0,0) i ,(^5,^5) = (4,6)。 

因此有， 

= 厂 6] ㊉ (w>'5 ， B) = ! (4,6) \ 

由函数 m(5 7 j) 可知， 

/>[5] = 1(0,0),(4,6)1 

又由 （ m ；4， u 4) = (5,4〉知， 

g [5] = p [5] ㊉ （ W4 , tu ) = I (5,4)，(9, 10) 1 

从跳跃点集 / >[ 5 ]与《: 5 ]的并集 

p [5] U q [5] = |(0,0)，(4,6)，(5,4)，(9,10 )i 

中我们看到跳跃点 (5,4) 受控于跳跃点 (4, 6 )。将受控跳跃点(5,4)清除后，得到 p [4] = K 0, 
0)，(4,6),(9，10)丨，从而得到函数 m (4， y )。 

依此方式递归地计算出， 

^[4] - p [4]@(6,5) = 1(6,5),(10,101 
p [3] = 1(0,0),(4,6),(9,10),(10.11)! 

分 [3] = ^[3] 0(2,3) = 1(2,3),(6,9 )i 

p [2] = I (0,0),(2,3),(4, 6 ),( 6 ,9),(9,10),(10,11 )I 

^[2] = P [2]®(2,6) = l (2,6)，(4,9)，(6，12),(8，15 )i 

p [ l ] = 1(0,0),(2,6),(4,9),(6,12),(8,15)1 

P [ l ] 的最后的那个跳跃点 (8,15) 给出所求的最优值为 m ( l ， c ) = 15。 

综上所述，可设计解 0-】 背包问题的改进的动态规划算法 如下： 

• •••••••• , • % 9 m ^ • • A - • •• • 1 J ^ • , • • • • J r ^ w • • -p • 

template < class Type > 

Type Knapsack(int n,Type c，Type vL],Type w[],Type * * p“m x[]) 

馨 

ml * head = new int [n + 2]; 
head[n + 1 」 = 0; 

P [_i = 0 ; 

p[0][l] = 0; 
int left = 0 ， 
right = 0 y 
next = 1; 
headinj = 1; 

for (int i = n;i > - 1 ;i --） i 
int k = left; 

for (int j = hhij < = rightjj + + )( 
if ( p [ j ^[0] -f w [ i ] > c ) break ; 

Type y - p[j]H + wLiJ ♦ 
m - p[jJUJ + v[i]; 
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w^hile (k < = right & & p[k][0] < y) \ 
p[nextJLO] = pLk][0]; 
p[next + + ]l 1 ] - p[k + + ][ 1J ； 

I 

if (k < = right & & p‘k][0] = = y) ; 

if (m < ptkjfl J) m = p[k][ l]i 



if (m > next - 1 ] [ 1 ]) I 

pLnext].0] = y; 

p[next + + ][1] = m; 

I 

while (k < - right & & p[ kj[ l] < = p[ next - l ][ 1 ]) k+ + ; 

I 

l 

while (k < =： right)) 
p L next][0] = p[k][0j; 

p[next + + ][ 1] = P[k+ + j 〔 l]; 

left - right + l; 
right 二 next - 1; 
headti - 1 ] = next; 

i 

Traceback(n ， w, v,p, head, x) i 
return p[ next - 1 j [ 1 j; 


template < class Type > 

void Trac*?back(int u，Type w[」• Type v[ j ， Type * * p，int * headjnt x[..) 

I 

i 

Typej = p[headl.O] - 1 J [0_ , 
m = p[heaxi[0j - 1][ 1 j ; 
for (ini i= ： l;i<=n;i + + )i 
xiij = o ； 

for (int k = head[i + l];k < = head[i] - 1;k 4- + )[ 

if (p[k]'_0] + w[i] - - j && p[k][l] + v[i] = =： m) i 
x[i] 1; 
j = p-kj[0]i 
m = p[k][ 1 ]; 
break ； 



上述算 法的主要计算量在于汁算跳跃点集 p [ i ](\ ^ n )。 由于以/ + 1] = p[i + 1] 

@(%，1^)，故计算( ? ；：丨 + 1] 需要 0(1 1) 计算时间。合并 p[i + 1] 和心 + 1] 并清 
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除受控跳跃点也需要 0(1 + 1] I )计算时间。从跳跃点集的定义可以看出， /)[;] 中 
的跳跃点相应于七，…，％的 0，1 赋值。因此， pj ] 中跳跃点个数不超过 + 由此可见，算 
法计算跳跃点集 p [ i](i ^ i ^ n ) 所花费的计算时间为 

I p：i + 1] l ) = o (^2^0 = 0 ( 2 n ) 

i -2 t^2 

从而，改进后算法的计算时间复杂性为 0( 23。当所给物品的重量 ^ r (L ^ «) 是整数 

时 ， I p [ i ] 1,(1 ^ i ^ m )。 此时，改进后算法的计算时间复杂性为 0(mifiUc，2N)。 

3.11 最优二叉搜索树 


设 S = { xi , x 2 r t, , 是一个有序集，且 q < …< %。表示有序集 S 的二叉搜索 
树利用二叉树的结点来#储有序集中的元素。它具有下述性质 :存储 于每个结点中的元素 x 大 
于其左子树中任一结点所存储的元素，小于其右子树中仟一结点所存储的元素。二叉搜索树的 
叶结点是形如的开区间。在表示 S 的二叉搜索树中搜索一个元素&返回的结果有 
两种情形： 

(1) 在二叉搜索树的内结点中找到 ; c = 

(2) 在二叉搜索树的叶结点中确定^ e ( u /+ 】）。 

设在第 ( 1 ) 种情形中找到元素％ = A 的概率为心;在第 (2) 种情形中确定 
的概率为义。其中约定〜= - 00,；^ + | «>。显然，我们有 

n n 

^ 0,0 ^ I ^ n; bj ^ 0,1 ^ y ^ /t; S + S *； = i 
yb n , a n ) 称为集合 S 的存取概率 分布。 

在表示 S 的二叉搜索树 F 中，设存储元素~的结点深度为叶结点 + 0的结点深 
度为 djM 

n n 

p ^ + + > y_ J ajdj 

表示在二叉搜索树 r 中作一次搜索所 i 的平均比较次又称为二叉搜索树 r 的平均路长。 
在一般情形下，不同的二叉搜索树的平均路长是不相同的。 

最优二叉搜索树问题是对干有序集 s 及其存取概率分布在所有 
表示有序集 s 的二叉搜索树中找出一棵具有最小平均路长的二叉搜索树。 

1.最优子结构性质 


二叉搜索树 r 的一棵含有结点&， *♦ ♦…和 叶结点，；0,…，（~， u ) 的子树可以看 
作是有序集 U ,， …，'丨关于全集合 UM ，~ + l i 的一棵二叉搜索树，其存取概率为下面的条件 
概率 


h - b k /Wijyi ^ k ^ j ; a h = a h /w 


1 矣&矣 y 


其中， =： «/_! + b { + + bj + 


设〜是有序集丨〜，…，关于存取概率，五，…，的一棵最优二叉搜索树，其 
平均路长为7\ ; 的根结点存储元素、。其左右子树 A 和7\的平均路长分别为 P / 和；)^由 
于乃和 7 V 中结点深度是它们在中的结点深度减1，故我们有 
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= W i,j + + W ^4 l,；^r 

由于乃是关于集合！ f 的一棵二叉搜索树，故 R 。若 A > />i ， m _l ，贝 1 J 

用替换乃可得到平均路长比。更小的二叉搜索树。这与 7 ^是最优二叉搜索树矛盾 3 
故乃是一棵最优二叉搜索树。同理可证 T ； 也是一棵最优二叉搜索树。 W 此最优二叉搜索树问 
题具有最优子结构性质 。 

2. 递归计算最优值 

最优二叉搜索树7^的平均路长为则所求的最优值为 Pl ， n 。 由最优二叉搜索树问题的 
最优子结构性质可建立计算的递归式如下 

= w i,j + mm i iv iyk _ ]pitk .i + 〜 ' ， jPk“.j' “ ^ j 

初始时， pi,w = O t 1 ^ i n .^. 

记为 (纟， /)，则， n ) = w l , nP\ t n - 为所求的最优值。 

计算 m (〖， y ) 的递归式为 

m(i ,i) - tv t + min ! m( tA - 1) + m(k + 1 1 y ) K i ^ j 

m(i 3 i - 1) = 0， 1 矣 i ( n 

据此，可设计出解最优二叉搜索树问题的动态规划算法 OptimalBinarySearchTree 如下： 

__ ■ 馨％ 黌产 • 馨 - _ *_ 瓤•麝觚 _•_ _ ^ 參參馨壽 ■馨 ■气垂 *垂 《• 

void OptimaIBinarySearchTree(jnt a, int b y int n, 

int * * m，int * * s，int 并 * w) 

J 

I 

for (int i - 0 ; i < - n; i + +)[ 
w[i + l][i] - a[i] i 
in[i + l][i] = 0 ; 

I 

for (int r = 0 ； r<n;r + + ) 

for (int i ^ 1; i < - n - r; i + +) | 
intj = i + r; 

w[i][jj = w[i]Lj - 1' + a[j] + b[j]; 

= m[i -f- l]Lj]; 
s[i][j] = i; 

for (int k = i+ i;k<=j ； k+ + )i 
int t - m[i][k - l] + m[k+ l][j]; 
if (t < m[i][j]) i 
m_i][j: = t; 

s[i ： [j] = k；| 

I 

I 

m[i][j] + = w[i]!.jj; 


3. 构造最优解 

算法 OptimalBinarySearchTree 中用 s [ t ][ j ] 保存最优子树 T ( i , j ) 的根结点中元素 c 当 
s [ l ][ R ]= k 时， ^ 为所求二叉搜索树根结点元素。其左子树为 TUA - 1)。因此 
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i = s [ l ] Ik - 1] 表示 T(\,k - 1) 的根结点元素为依此类推，容易由 S 记录的信息在 
0 U ) 时间内构造出所求的最优二叉搜索树。 

4. 计算复杂性 

算法中用到3个二维数组和 w ， 故所需的空间为 0( 算法的主要计算量在于计算 
mm | m(i,k - 1 ) 4- m ( k + 1,y ) i 。对于固定的 r ， 它需要计算时问 0( y_f + l) = 0( r + 1 ) 0 

因此算法所耗费的总时间为 + 1) = ou 3 )。 

事实上，在上述算法中4以 i 明 

min + + = .min. |m(i ，々一 i)+m (々 + 1 ， j)l 

i^k^j c + i ][y I 

由此可对算法作出进一步改进 如下： 

• ▼ j • I - • • • • • • • • • • * ' * 

void OBST (int a, int b, int n, 

int v ^ int * * s，int * * w) 

j 

for (int i = 0;i<=n;i+ + ){ 
w[i + l][i] = a[i]; 

m[i + 1 ] [i] = 0; 

s[i + lj[i] = 0; 

? 

for (int r = 0; r < n; r + + ) 

for (int i = 1 ； i < = n - r; i + + )1 
int j - i + r, 

il = 1] > i?«[i][j- l]:i, 

jl = s[i+ l][j] > i?s[i+ l][j]:j ； 
w[i][jj = w[i]:j - 1] + a[jl + b[j]; 

m[i][j] = in[i][il - 1] + m|_il 十 l] 〔 j]; 

s[i]:j] = il; 

for {int k = il + 1 ; k < = jl; k + +) I 
int t = m[i] [k - 1 ] 4- m[k + 1 ][j] ; 

if (t < = m[i][j]) j 
m[_i 」 [j] = U 

I 

+ = w[ij[j"; 


改进后算法 OBST 所需的计算时间为 0 U 2 )， 所需的空间为 0[八 
在下一节中,我们将在较一般的意义上证明上述改进后的算法 OBST 的正确性。 

3.12 动态规划加速原理 

从本章前几节的讨论中我们看到，许多可用动态规划求解的问题具有类似的递归计算式。 
本节中，我们来考察一个常见的动态规划递归式，并讨论其计算复杂性。 
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设 w (1. 7 ) C . 1 ^ I < y ^ n ell m ( i \ y ) 的递归计算式力 

m(i “) = 0, l ^ i n 

m (J ， j) = w( i ， j) + min l m (l ， k - 1)+ m (k ,j) \ , 1 ^ i < j 矣 n 

最优二叉搜索树问题的动态规戈 ffi 归式是 t 述递!)」式的特殊情形，将那里的出（| + 1, y ) 
换成这里的并将那里的 rn (( + 】， y ) 换成这里的 m ( Ly ), 则得到相同的递归式： 

1.0 U 3 ) 时间算法 

根据递归式，按通常方法可设汁计算的动态规划算法如 

• • _ • • _ 

• • • 

void DynamicProgramming(int n $ int * * m，int + * s，int ^ ^ w) 

8 

I 

for (int i = 1; i < = n; i + 十 ）| 

m[ijLi"J - 0; 

sLi-[ij = Oi 

j 

I 

for (int r - 1; r < «; r + + ) 

for Cint i=l;i<=n~ri i+ + )) 
int j = i + r; 
w 〔 i][j? = weight(i,j); 

- mLi -f 1 jg " 1 ； 
s[i][jj = i; 

for (int k = i + 1; k < j; k + +); 
int I = ni[i]-k] + m[k 十 l][j]; 

if (t < = mtij(jj)) 
m[i][.jj = t; 
s[i][j] = k; ! 

I 

參 

I 

j[j」+ = w[i]^j]; 

! 

• _ _ • • % • • • 

算法 DynamieProgramming 滿要 0( n 3 ) 计算时间和 0( u 2 ) 空 ㈣ 。 

2. 四边形不等式 


在上述计算的递！ H 式中，当函数 w ( i . j ) 满足 

w ( i , j ) + w ( i , ,/ ) ^ w(i , j ) + w ( i,f ), I i r < j sc f 

时，称 w 满足四边形不等式。 

当函数 《； U ，/) 满足 w { i \ j ) ^ i f < j ^ f 时，称『关于 R 间包含关系 

单调。 

例如，在最优二叉搜索树问题中，由 tt x ^ 0,0 ^ i ^ n ; k > 0,1在 ） 彡 n %, w ( i . j ) M . 
然满足单调性。另一方面， 

w ( i ^ j ) -)- w ( i \ j f ) = w{t y j ) + i i r < j <c / 

即 w 也满足四边形 +等式 

对于满足四边形不等式的单凋函数■推知由递归式定义的函数也满足四边 
形不等式，即 
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m(isj) + m(i f ，/) ^ m( i’ ， j) + < j ^ / 

这一性质可用数学! )1 纳法证明。我们对四边形不等式中的“长度 ”/=/ - 〖应用数学归 
纳法。 

当 Z f 或 y = /时，不等式显然成立◦由此可知，当 /在1 时，函数 ； n 满足四边形不等式。 
下面分两种情形进行归纳证明。 

情形 1 i < i/ = j < f Q 

此时，四边形不等式简化为下面的(反）三角不等式 

-f- m(j ， j ’） 安 

设女 =maxUl m ( i 9 j f ) = m ( i y t - m ( t , f ) + w U ，/ ) 丨，再分两种对称情形 * 矣 y 

或 k > j 0 

情形 1.1 k ^ j 

此时我们有 : wU ， j，）+ m(i，k - 1) + mU ，/)。 因此， 

4 - m(j ，/ ) ^ w{i,j) + m(i,k - 1) + m(k ， j) + m(j ， f) 

矣 wiitf) + m(i ， k-\) + m(k ， j) + m(j ， j ’、 

^ w(i , / ) + m(i ,k - 1) + m(k ， f) 

= mUy /) 

情形 1.2 A ： > ) 

证明与情形 1,1 类似。 

情形 2 i < r < j < / 

设 r - maxi t I m(i f ， j) = / n ( i r ,i - 1) + m(t y j) + w ( 〆 ， 川 
z = max 1 1 I - m(i f t - 1) + m ( t ， / ) + w (i)1 

仍需再分两种情形讨论，即 $ 矣:^或 2 > y 。 我们只讨论 z y 的情形 ，z > y 的情形是对 
称的。 

首先注意到由;> 和3的定义有 z z c 由此我们有 

+ m ( i f ,/) ^ w ( i , j ) + m ( i f z - I ) + + w ( i f ,/) + m ( i r y y - 1) + m ( y , f ) 

^ w(iij) + ,y) + m(i , y - 1) + m(i，z - 1) + m(z y j) + m{y t f) 

^ + + mii t y - 1) + m(i y z - l) + m{y,j) + m(z,j) 

- + m ( ij ) 

综上所述，由数学归纳法即知 . m ( i . j ) 满足四边形不等式 c 

定义 s ( Z ， y ) = max { k I m(i,j) - m(i,k - l) + m(k,j) + w { t , y)i 由函数 的 

四边形不等式性质可推出函数 s(i,j) 的单调性，即 

s(ifj) ^ s(i,j + 1) < s(i + 1,；' -f 1), i ^ j 

事实上，当纟 = y 时，单调性不等式显然成立。因此我们只要讨论〖< /的情形。由于对称 
性，我们只要证明 sU , y ) 矣 s ( i 9 j ^\) 0 

为了便于讨论，记 rrifidyj) - m(i y k - 1 ) 4 - tn{k t j) + w(i,j) 0 

由 s ( i . j ) 的定义可知，为证明 ■ + 1)，只要证明对所有 i < k 备 k f ^ j ， 有 
^ rn k ( i 9 j ) 蕴涵 m k ^( i,j + 1 ) ^ m k ( l f j + 1 ) c 

事实上，我们可以证明一个更强的不等式 

m k (i f j) - m k {iyj) ^ + l) - + 1) 


或等价地 
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fn k ( iyj) + m k . (i ， j + 1 〉矣 m k ( i,j + 1 ) + ni k >(J 、 j) 

将式 1 四项按它们的定义展:开可得 

,j) + m{k\ j + 1 ) ^ + m( k ,j + 1 ) 

这正是在 k $ k ， 砭 j < j + 1 时的四边形不等式 D 

综 t 所述，可得到如下重要结 论：当 W 是满足四边形不等式的单调函数时，函数 
单调。 

3,加速算法 

根据前面的讨论，当 w 是满足四边形不等式的单阔函数时，函数蚁 i ，/) 单调，从而 

min | w ( “ — 1 ) + ni(k t j )} = min \ m ( i , k , - 1) + m(k y i )\ 

由此可对算法 DynamicProgramming 作如下改进： 

籲籲參 __ 争參 ____ 參 4 •籲 § 0 • | 

void SpeedDynamicProgrammin^ (hit 11 ， int * * int * * s，iiit * ^ w) 
for (ini i = 1 j i < = n； i + +) i 

m[ij r ； i] = 0; 

s[i] r L i] = 0i 
I 

I 

for (ini r = 1; r < n; r + + ) 

for (int i = 1; i < = n - r; i + + ) i 
int j = i + r ， 

il = s[i][j^ 1] > i ? s[i][j- l] ： i, 
jl = s[i> l][j? > 1 ? s[i + - 1; 

w[i][j] = weight^ i»j); 
ni[i][j] = m[i][—il] + m[il + l][j ]； 
s[i][j] = il ； 

for (int k = il + I.; k < = jl; k + +) j 
int t = ni[i][k] + m[k + I][j]; 
if (t < = m[i][j]) i 

m[i]Lj] = t; 
s[i][jj =： k;; 

l 

I 

十 =w[ij 「 j 二； 


改迸后算法 SpeedDynamicProgramming 所需的计算时间为 


n-l n- 


0 ( (1 + 5(i + ] ^ i + r) — s( i ^ l ^ r — 1))) 


0 


1 

^ r + s( a - r ， n) - s(l f r))) 


0 






0 


= 0(n 2 ) 

由于最优二叉搜索树问题的动态规划递归式中 W 是满足四边形不等式的单调函数，由前 
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向的讨论即知 ，兑法 OBST 是止 确的. 


习题 3 

3-1 设计一个 0 U 2 ) 时间的算法，找出由 n 个数组成的序列的最长单调递增子序列。 

3,2将习题 3-1 中算法的计算时间减至0(/11%〃）。(提不： -个长 度为纟的候选子序列 
的最后一个元素至少与一个长度为/ - 1的候选子序列的最后一个元素-样大。通过指向输入 
序列中元素的指针来维持候选子序列)。 

3-3 用2台处理机4和6处理 n 个作业。设第/个作业交给机器4处理时需要时间化， 
若由机器谷来处理，则需要时间由于各作业的特点和机器的性能关系，很可能对于某些沁 
有而对于某些/ (，有 a , < 既不能将一个作业分开由2台机器处理，也没有一 

台机器能同时处理2 个作业 。设计一个动态规划算法，使得这2台机器处理完这 n 个作业的时 
间最短(从仟何一台机器开工到最后一台机器停工的总时间）。研究一个实例 ： （A , a 2 ， a 3 , 
a 5 ， a 6 ) = (2,5,7,10 t 5,2) ; ( » i 2 ^3 t t 4 , 6 5 , = (3,8,4, 1 1,3,4) 0 

3-4 设有 n 种不冋面值的硬币，各硬币的面值存于数组 T [ hn ] 中 。现要 用这些面值的 
硬币来找钱。可以使用的各种面值的硬币个数小限。 

0) 当只用硬币面值 T [1]， T [2]， …, T [/] 时，可找出钱数/的最少硬币个数记为 C (“ 
; )。若只用这些硬 币时值 ，找不出钱数 J 时，记 CU ，/) =〜给出 C ( i ， y ) 的递归表达式及其初 
始条件 cl 1^7^ La 

( 2 ) 设计一 t 动态规划算法，对 i s L , 计算出所有的 CU , J )。 算法中只允许使用一 
个长度为^的数组..用/:和〃作为变量来表示算法的计算时间复杂性。 

⑶在矣/」，已计算出的情况下，设计一个贪心算法，对任意钱数 L ， 
给出用最少硬币找钱 m 的方法。当 CU ， 一# a 时，算法的计算时间应为 0 U + C ( n ， 
m ))。 

3-5 用关系“ < ”和“=”将3个数4』和 C 依序排列时，有13种不同的序 关系： 

A ^ B ^ C\A = B < C f A < B = C,A < B < C,A < C < B 
A = C < B,B < A = C,B < A < C f B < C < A，B = C < A 
C<A=B ， C<A<8 ， C<B<A 

若要将 a 个数依序进行排列，设计-•个动态规划算法，计算出有多少种不同的序关系。要 
求算法只占用空 N 0 U )， 且只耗时 0( n 2 ). 

3-6 设给定/7个变量。将这些变量依序作底和各层幂，可得 a 重幂如下 


义 3 

工 2 
文1 

这里将上述 a 1幂看作是不确定的，当在其屮加入适当的括号后，才能成为一个确定的 n 
重幂。不同的加括5•力 式导致 不同的 /I 重幂。例如，当 n = 4时，全部4重幂有5个。试设计一个 
动态规划算法，对 ri 个变量计算出有多少个不同的^軍幂 2 要求算法只占用 0 U ) 空间，且只 
耗时 0 ( n 2 ) c 
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3*7 给定由 《 个英文单词组成的一段文章，每个单同的 U ： 度(宁符个数）依序为 h 、 h ,， 
…，4。我们要在一台打印机上将这段文章“漂亮地”打印出来。打印机每行菽多可打印 W 个卞 
符。这里所说的“漂亮”的定义如下。在打印机所打印的毎一行中，行 S 和行 M 可不留空格。行 
中每两个单同之间留一个空格,、这样，如果在一行中打印从单词/ 到筚词 /的字符，则按打印规 

则，应在一行中恰好打印公4 + I •个字符(包括字 M 空格字符），且不允许将中词打破.多余 

k = I 

的空格数为财 y +〖-々。除文章的最肟▲行外，希望每行多余的？格数尽吋能少。因此， 

我们以各行(最后一行除外) 的多余 空格数的立方和达到最小作为“漂亮”的标准、、试用动态规 
划算法设计一个“漂亮打印”方案，并分析算法的计算复杂件。 

3-8 设4和5是两个字符串。我们要用最少的字符操作将字符串4转换为字符 串衫这 
M 所说的字符操作 包括： 

(1) 删除一个字符。 

(2) 插入一个字符。 

(3) 将一个字符改为另一个字符。 

将字符串4变换为字符串《所用的最少字符操作数称为字符串4到的编辑距离， 
记为试设计一个有效算法，对任给的两个字符串4和沒，计算出它们的编辑距离 
d(A ， B ) 0 

3-9 在一个圆形操场的四周摆放# «堆石 子:现 要将石子有次序地合并成一堆。规定每 
次只能选相邻的两堆石子合并成新的一堆，并将新的一堆石子数记为该次合并的得分。试设计 
一个算法，计算出将〃堆石子合并成一堆的最小得分和最大得分，并分析算法的计算复杂性： 

3-10 给定一个由行数字组成的数字三角形。试设计一个算法，计算出从二角形的顶至 
底的一条路径，使该路径经过的数字总和最大，并分析算法的计算复杂件。 

3-11 考虑下面的整数线性规划问题 

max^j 

【=】 

；■ 

[ XI AH & 

丨 c l 

为非负整数，〗系丨客 " 

试设计一个解此问题的动态规划算法，并分析算法的计算复杂性、、 

3-12 给定〃种物品和一背包。物品 i 的重量是体积是乂 iff 价值为背包的容量 
为 C ， 容积为/)。问应如何选择装入背包中的物品，使得装人背包屮物品的总价值最大?杵选择 
装入背包的物品时，对每种物品纟只有两种选择,即装入背包或不装入背包,不能将物品^装人 
背包多次，也不能只装人部分的物品“试设计一个解此问题的动态规划算法，并分析算法的 
计算复杂性。 

3-13 考虑定义于字母表 S = U ，6， cLh 的乘法表 如下： 
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依此乘法表，对任-定义于>]上的字符串，适当加括号后得到一个表达式。例如，对于字 
符串 X = WWcx ， 它的一个加括号表达式为依乘法表,该表达式的值为〜试设 
计一个动态规划算法，对任一定义于 I ]上的字 符串％ = 计算有多少种不同的加 

括号方式，使由导出的加括号表达式的值为 a ，并分析算法的计算复杂性。 

3 - 14 Ackerniann 函数^4 ( m , « ) 可递归定义如下： 

I n + 1 " 1=0 

A ( m - 1,1) m > 0, ?? = 0 

A ( m - 1, i4 ( - ])) rn > 0, n > 0 

试设计一个计算 .4( m ，《) 的动态规划算法，该算法只占用空间（提示 ：用两 个数组 
val [0: m ] 和 ind [0: m ] ， 使得对任何 i 有 val [ /] = A ( i » ind [ i ])) • 

3-15 长江游艇俱乐部在长江上设置了 a 个游艇山租站1，2,…，〜游客可在这些游艇 
出租站租用游艇，并在下游的任何一个游艇出租站归还游艇。游艇出租站；到游艇出租站 y 之 
间的租金为 r ( i ， jU 《 i < j 安 〜试设计一个算法，计算出从游艇出租站 < 到游艇出租站 y 
所需的最少租金,并分析算法的计算复 杂性。 

3~16给定一个 /V * / V 的方形网格，设其左上角为起点坐标为（〗，】），1轴向右为正， 
r 轴向下为正，每个方格边长为1。一辆汽车从起点 s ’ 出发驶向右下角终点 r ， 其坐标为 
( yv ，/ v )。 在若干个网格交叉点处，设置了油库，可供汽车在行驶途中加汕。汽午在行驶过程中 
应遵守如下 规则： 

(0 汽车只能沿网格边行驶，装满油后能行驶 a 条网格边。出发时汽车已装满油，在起点 
与终点处不设油库2 

(2) 当汽车行驶经过一条网格边时，若其 y 坐标或 r 坐标减小，则应付费用 B ， 否则免付 
费用。 

(3) 汽车在行驶过程中遇油库则应加满油并付加油费用 4 。 

(4) 在需要时可在网格点处增设油库，并付增设油库费用 C (不含加油费用4)。 

(1) 〜 （4) 中的各数#，火，4,5,0均为正整数。试设计一个算法，求出汽车从起点出发到 
达终点的一条所付费用最少的行驶路线。 

3-17 给定一个 m * / I 的矩形网格，设其左上角为起点 S 。 一 辆汽车从起点 S 出发驶向右 
下角终点 T 。 网格边上的数字表示距离。在若干个网格点处设置了障碍，表示该网格点不可到 
达。试设计一个算法，求出汽车从起点 S 出发到达终点7 1 的一条行驶路程最短的路线。 

3-18 关于整数的二元运算#定义为 

( X # Y ) = 十进制整数 X 的各位数字之和*十进制整数 F 的最大数字 + K 的最小数字 
例如， (9 #30) = 9*3 + 0 = 27 o 

对于给定的十进制整数 Z 和 A ：, 由义和#运算可以组成各种不同的表达式。试设计一个 
算法，计算出由/和#运算组成的值为欠的表达式最少需用多少个#运算。 

3-19 给定一张航空图，图中的顶点表示城市，边表示城市间的直通航线。试设计一个算 
法，计算出一条满足下述约束条件且含城市最多的旅行路线。 

.(1) 从最西端的城市出发，单方向由西向东到达最东端的城市。然后，冉单方向由东向西 
飞回起点(可途经若干城市)。 

(2) 除起点城市外，每个城市最多只经过一次。 
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3-20 商店屮每种商品都朽标价:例如 ，一 朵花的价格是 2 元，一个花瓶的价格是 5 / l : 为 
了吸引顾客，商店提供了一组优惠商品价。优惠商品是把一种或多种商品分成一组，并降价销 
售。例如， 3 朵花的价格不是 6 元而是 5 元。 2 个花瓶加 1 朵花的优患价是 10 元试设 il 一个 掌_: 
法，计算出某一顾客所购商品府付的最少费用。 

3-21 一个立方体被分割成 P 个小立方体。每个小立方体内有一个整数。试设计~ '个算 
法，计算出所给立方体的最大子长方体。子长//体的大小由它所含所有整数之和确定。 

3-22 许多操作系统采用正则表达式来实现文件匹配功能。一种简单的正则丧达式由英 
文字母、数字及通配符“*”和“?”组成。“?”代表任意一个字符则可以代表任意多 t 字 
符。现要用正则表达式对部分文件进行操作。 

(1) 试设计一个算法，找出一个止则表达式，使其能匹配的待操作文件最多，但不 能四配 
任何不进行操作的文件。所找出的正则表达式的长度还应是最短的。 

(2) 试设计一个算法,用最少的正则表达式 K 配所有待操作文件。 

3-23 给定平面匕/ I 个点，这《个点的双单调欧氏旅行售货员回路是从最 t 点升姶，严 
格地由左至右，然后再严格地由右向左直至出发点的闭合回路。除最左点外，该凹路经过每个 
点恰好一次。试设计一个求这 a 个点的双单调欧氏旅行售货员回路的算法。 
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第 4 章贪心算法 


学习要点 

■ 理解贪心算法的概念 
• 掌握贪心算法的基本 要素： 

(1) 最优子结构性质 

(2) 贪心选择性质 

• 理解贪心算法与动态规划算法的差异 
• 理解贪心算法的一般理论 
♦ 通过下面的应用范例学习貪心设计 策略: 

(1) 活动安排问题 

(2) 最优装栽问题 

(3) 哈夫曼编码 

(4) 单源最短路径 

(5) 最小生成树 

(6) 多机调度问题 


当一个问题1%有最优子结构性质时，我们会想到用动态规划法去解它。但有时会有更简 
单有效的算法。我们来看一个找硬币的例子 5 假设有四种硬币，它们的面值分别为二角五分、 
一角、五分和一分。现在要找给某顾客六角三分钱 c 这时，我们会不假思索地拿出2个二角五 
分的硬币，1个一角的硬币和3个一分的硬币交给顾客。这种找硬币方法与其他的找法相比， 
所拿出的硬币个数是最少的。这里，我们下意识地使用了这样的找硬币算法:首先选出一个面 
值不超过六角三分的最大硬币，即二角五分;然后从六角三分中减去二角五分，剩下三角 八分; 
再选出一个面值不超过二角八分的最大硬币，即乂一个二角五分，如此一苠做下去。这个找硬 
币的方法实际上就是贪心算法。顾名思义，贪心算法总足作出在当前看来是最好的选择。也 
就是说贪心算法并不从整体最优上加以考虑，它所作出的选择只是在某种意义上的局部最优 
选择。当然，我们希望贪心算法得到的最终结果也是整体最优的。上面所说的找硬币算法得 
到的结果就是一个整体最优解。找硬币问题本身具有最优子结构性质，它叮以用动态规划算 
法来解。但我们看到，用贪心算法更简单 ，史直 接且解题效率更高，这利用了问题本身的一些 
特性。例如，上述找硬币的算法利用了硬币向值的特殊性。如果硬币的面值改为一分、五分和 
一 角一分3种， IW 要找给顾客的是一角五分钱。还用贪心算法，我们将找给顾客1个一角一分 
的硬币和4个一分的硬币。然而3个五分的硬币显然是最好的找法。虽然贪心算法不是对所 
有问题都能得到整体最优解，但对范围相当广的许多 H 题它能产生整体最优解。如图的单源 
最短路径问题，最小生成树问题等。在一些情况即使贪心算法不能得到整体最优解，但其 
最终结果却是最优解的很好的近似解。 
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4.1 活动安排问题 


活动安排问题是可以用贪心算法有效求解的一个很好的例子该问题迠求岛效地安排 • 
系列争用某一公共资源的活动。贪心算法提供了“ -个简单、漂亮的方法，使尽 " j 能多的活动能 


兼荇地使用公共资源。 

设有 〃个 活动的集合 e = h .2, …，^;，其中每个活动都要求使用问一资源.如演讲会场 
等，而在同一时间内只打一个活动能使用这一资源。毎个活动/都有一个要求使用该资源的 
起始时间~和一个结束时 N/ t ,iU <力。如果选择了活动 h 则它在 f 幵时问区间 、彳） 内 
占用资源。若区间[小乂）4区间 L v ，/,) 不相交，则称活动/与活动/是相容的、也 就记说 ，4 
5^/ y 或^為力时，活动〖与活动/相容。活动安排问题就是要在所给的活动集合中选出最大 
的相荇活动子集合。 

在下面所给出的解活动安排问题的贪心算法 （;reedv Selector 屮，各活动的起始时间和结 

w 

束时 M 存储于数组 s 和 f 屮 K 按结束时间的非 减序: fAf 2 df „ 排列。如梁所给出的活 
动未按此序排列，我们可以用 O ( nlog 〃） 的时间将它重排。 


template < class Type > 

void Greedy Se?lector(iiit Type s[ ] f Type f[ ], bool Aj) 


A[ 1 ] = true; 


int j = 1; 

for (int i = 2;i < = n;i + + ) i 
if (s[i] > = f[j]) { 

A[i] = true; 
j = i; 

I 

else A[i] = false; 


算法 Greedy Select or 中用集合 4 来存储所选择的活动。活动；在集合 .4 中 ，当上 1仅当 
A 〔 i ] 的值为 Uue 。 变量 ） 用以记录最近一次加人到4中的活动。 由亍 输人的活动是按其结 
束时间的非减序排列的,总是当前集合4中所有活动的最大结溆 时问 ，即 

贪心算法 GreedySelector —开始选择活动！，并将 j 初始 化为 h 然后依次检查活动/是 
否与巧前已选择的所有活动相 容,、 若相容则将活动〖加入到 Cl 选择活动的集合4屮，否则不 
选择活动〖，而继续检杏下一活动与集合4中活动的相容性。由于力总是当前集合4屮所有 
活动的最大结朿时间，故活动/与当前集合4中所有活动相容的允分 fl 必要的条件是其开始 
时间\不早于最近加入集合4中的活动 y 的结束时间尤，即若活动^与之相界，则/ 
成为最近加入集合4中的活动，因而取代活动 y 的位置。由于输人的活动是以其完成时间的 
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非减序排列的，所以算汰 GreedvSelec lur 每次总是选择具有最弘完成时 M 的相界活动加人集 
合4中。直观上按这种方法选择相容活动就为未安排活动留下尽可能多的时间也就是说， 
该算法的贪心选择的意义是使剩余的可安排时间段极大化，以便安排尽可能多的相容活动。 

算法 GreedySelertor 的效率极高。当输人的活动已按结束时间的非减序排列时，算法只 
需 0 WO 的时间 来安排 a 个活动，使最多的活动能相容地使用公共资源。 


例如，设待安排的11个活动的开始时间和结朿时间按结束时间的非减序排列如下: 
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算法 Greedy Selector 的计算过程如图 4-1 所亦。 



图 4-1 算法 GreedySdec ： tor 的计算过程 

图中每行相应于算法的一次迭代。阴影长条表示的活动 是己选 人集合4中的活动，而空 
白长条表示的活动是当前正在检查其相容性的活动。若被检查的活动 i 的开始时间^小于 
最近选择的活动 y 的结束时间/}，则不选择活动〖，否则选择活动；加人集合4中。 

贪心算法并不总能求得问题的整体最优解。但对于活动安排问题，贪心算法 GreedySe- 
iectur 却总能求得的整体最优解，即它最终所确定的相容活动集合 A 的规模最大。我们可以 
用数学归纳法来证明这个结论。 
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串实上，设6=丨1,2，〜，,1;为所给的活动集合。由于中活动按结束时间的非减序棑 
列,故活动1具有最早的完成吋间，首先我们要证明活动安排问题有一个 M 优解以贪心选择 
开始 ，即该最优解中包含活动 I 。设4 是所给的活动安排问题的一个 最优解 ，且4屮4 
动也按结束时间非减序排列，^中的第一个活动足活动 ^k = \M a 就足一个以贪心选 
择几始的最优解。若 / r > l ， 则我们设月= 4 -4; Uilk 、 由于且1中沾动是且大相 
容的，故 B 中的活动也足互为相容的..、义由于 B 屮活动个数4 .4 中活动个数相冋，且 .4 足 
最优的，故 B 也适最优的。也就是说 S 是一个以贪心选择活动1开始的报优活动安排3 
此，我们证明了总存在一个以贪心选择开始的最优活动安排方案:， 

进一步，在作了贪心选择，即选择了活动丨后，原问题就简化为对£ 中岍 打与活动 】 m 
的活动进行活动安排的子问题。即若4足原问题的 • ‘个最优解.则 A f = A - i M 足活动安排 
问题 E f = \ie 的一个最优解。事实上，如果我们能找到 f 的一•个解 y ， 它包; n 匕 

1更多的活动，则将活动1加入到 R 中将产生 E 的一个解石，它包含比 A 电多的活动.这与 
A 的最优性矛盾。因此，每一步所作的贪心选择都将问题简化为•个史小的与原问题具有相 
N 形式的子问题。对贪心选择次数用数学归纳法即知，贪心算法 GrccdySt.levtot 最终产土原 

问题的一个最优解 3 

4.2 贪心算法的基本要素 

贪心算法通过一系列的选择来得到一个问题的解。它所作的每一个选择都是当前状态下 
某种意义的最好选择，即贪心选择、、希望通过每次所作的贪心选择竽致最终结果是问题的- 
个最优解。这种启发式的策略并不总能奏效，然而在许多情况下确能达到预期的 H 的。解话 
动安排问题的贪心算法就是一个例子。下面我们着重 H •论呵以用贪心算法求解的问题的一般 
特征.、 

对于一个具体的问题，我们怎么知道是否可用贪心算法来解此问题，以及能否得到问题的 
一个最优解呢？这个问题很难给予肯定的回答 c 但是,从许多吋以用贪心兑法求解的问题+ 
我们看到它们般 M 有两个重要的 性质: 贪心选择性质和最优子结构性质。 

1 . 贪心选择性质 

所谓贪心选择性质是指所求问题的整体最优解可以通过-系列局部最优的选择，即贪心 
选择来达到。这是贪心算法可行的第一个基本要素，也是贪心算法与动态规划算法的土要区 
别。在动态规划算法中，每步所作的选择往往依赖于相关子问题的解。因曲只有在解出相关 
子问题后，才能作出选择。而在贪心算法中，仅在当前状态下作出最好选抨，即 M 部最优选抨; 
然后再去解作出这个选择后产生的相应的子问题。贪心算法所作的贪心选择4以依赖于以汴 
所作过的选择，但决不依赖于将来所作的选择，也不依赖 于了问 题的解。足由于这种宠别， 
动态规划算法通常以 A 底向上的方式解各子问题，而贪心算法则通常以 A E 《向下的方式进行. 
以迭代的方式作出相继的贪心选择，每作一次贪心选择就将所求问题简化为•一个规模史小的 
子问题。 

对于一个具体问题，要确定它是否 其有 贪心选择性质，我们必须证叫每一步听作的贪心选 
择最终导致问题的 < -个整体最优解：通常可以用我们在证明活动安排问题妁贪心选抨性质时 
所采用的方法来 证明。 首先考察 H 题的一个整休最优解，并证明可修改这个最优解，使其以赏 
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心选择开始。而 a 作 r 贪心选择后，原问题简化％ ▲个 规模更小的类似子 m 题。然后，用数学 
H 纳法证明，通过毎 •步 作贪心选择，最终可得到问题的一个整体最优解。其中，证明贪心选 
择后的问题简化为规模更小的类似子问题的关键在丁利用该问题的最优子结构性质。 

2.最优子结构性质 


巧-个问题的最优解 包含# 它的子问题的最优解时，称此问题具有最优了-结构性质。问题 
所具冇的这个性质是该问题对用动态规划算法或贪心算法求解的一个关键特征。在活动安排 
问题屮，其最优子结构性质表现为:若 a 是对于瓦的活动安排问题包含活动1的一个最优解， 
则相容活动集合^ - .4 ^ 丨1 丨是对于 E f = \ E ： Sl ^ /,丨的活动安排问题的一个最优解。 

3. 贪心算法与动态规划算法的差异 


贪心算法和动态规划算法都要求问题具有最优 了结构 性质，这是两类算法的一个共同点,. 
但是，对于…个具旮最优子结构的问题应该选用贪心算法还足动态规划算法来求解?是不是能 
用动态规划算法求解的问题也能用贪心算法来求解?下面我们来研究两个经典的组合优化问 
题，并以此来说明贪心算法 s 动态规划算法的主要差别。 

0-1 背包问题:给定 a 种物品和一个背包。物 I 的.軍:量是，其价值为 h ， 背包的容量为 
应如何选择装人背包中的物品，使得装入背包中物品的总价值最大？ 

在选择装入背包的物品时，对每种物品 i 只有两种选择，即装入背包或不装人背包。不能 
将物品 j 装人背包多次，也不能只装人部分的物品/:。 

此问题的形式化描述是，给定 C > 0, A > 0 ,h > 0,1 ^ ^ / i , 要求找出一个 ft 元 ( M 向 

n ii 

量 （q , ： t 2 , …，、），〜€ 10,1! ,1 < i 使得 X •矣 c ， 而且乏]达到最大。 

r = 1 i = 1 

背包问题:与 0-1 背包问题类似，所不间的娃在选择物品〖装人背包时，可以选择物品 Z 的 
一部分，而不一定要全部装入背包。 

此问题的形式化描述是，给定 C > 0，％ > 0,^ > 0,1 ^ I ^找，要求找出一个 n 元向量 

ri n 

( x ] ，. Y 2, …，、 ），0 矣 Jt : 莓 1，1 莓 i 莓 rt ， 使得 XI 切内矣 C ， 而且互]达到最大 cs 

i = 1 c = J 

这两类问题都具有最优子结构性质。对于 CM 背包问题，设,4是能够装人容量为 C 的背包 
的具有最大价值的物品集合，则 七 : = d - t / l 是 n _ I 个物品1,2 ,…， y - i，y + u …，^可装 
入容量为 C - %的背包的具有最大价值的物品集合。对于背包问题，类似地，若它的一个最优 
解包含物品/，则从该最优解中拿出所含的物品 y 的那部分重暈剩余的将是 n - 1个原重物 
品1,2^"，>-1，7 + 1，〜，以及重为％-仿的物品/中可装人容量为切的背包 a 具有 
最大价值的物品。 

虽然这两个问题极为相似，何背包问题可以用贪心算法求解，而 ( M 背包问题却不能用贪 
心算法求解。用贪心算法解背包问题的基本步骤是，首先汁算每种物品单位重量的价值 
1^/1^，然后，依贪心选择策略，将尽可能多的单位重量价值最高的物品装入背包。若将这种物 

品全部装人背包肟，背包内的物品总重量未超过则选择单位重量价值次高的物品并尽可能 
多地装人背包。依此策略一直进行下丄•直到背包装满为止。具体算法可描述 如下： 


春 _ _ • 

void Knapsack(int n , float M ? float v[ ], float w[ ], float x[]) 
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Sort ( "， v ， w ); 

int i: 

for {[: = 1; i < = n;i + + ) x [ i . - 0; 
float e = M ； 

for (i : = 1 ;i < = n;i + + ) 
if ( il > (0 break; 

xLiJ = 1; 

c - - W[L ; 

I 

\ 

if (i < = n) x[.i] = <;/w[i j; 


算法 Knap^ck 的主要计算时间在于将各种物品依其单位重 S： 的价值从大到小排序 （ 因 
此,算法的 il 算时间卜界为 OUlogrO。 当然，为丫证明算法的正确性，我们还必须证明背包问 
题具有贪心选择性质。 

这种贪心选择策略对 0-1 背包问题就不适用了。看图 4-2U) 中的例子，背包的容量为50「- 
克;物品1重10 千克; 价值60 元; 物品2電20千克，价值100 元; 物品3 130 丁克，价值120 
因此，物品1每千克价值6元，物品2每千克价值5元，物品3每千克价值4兀 ( 若依贪心选择 
策略，应 S 选物品1装入背包，然而从图 4-2(b) 的各种情况可以看出，最优的选 择方案 是选枰 
物品2和物品3装人背包。首选物品1的两种方案都不是最优的。对于背包问题,贪心选择最终 
吋得到最优解，其选择方案如图 4-2(c) 所 
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图 4-2 0-1 背包问题的例了 

对于 0-1 背包问题，贪心选择之所以不能得到最优解朵因为它 X 法保江最终能将背包装 
满，部分背包空间的闲置使每 T 克背包空间所具有的价值降低 r 。 事实上，在考虑 cm 背包问 
题的物品选择时，佐比较选择该物品和不选择该物品所导致的最终结果，然后再作出最好选 
择。由此就导出许多互相重叠的子问题。这正是该问题可用动态规划算法求解的另•重要特 
征。动态规划算法的确可以有效地解 0-1 背包问题。 


4.3 最优装载 


有一批集装箱要装上一艘载重量为 c 的轮船。其屮集装箱/的重 a 为 心: .最优装载问题* 
求确定，在装载体积不受限制的情况下，应如何装载才能将尽可能多的集装箱装卜_轮船：该问 
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题耐形式化描述为 



A 


^ c 

X = I 

Xf €- i J ^ i ^ n 


其小，变 M A =() 表示4、装人集装箱 i ^ X ( ^ \ 表水装人集装宋 td z 


1 . 算法描述 


最优装载问题可用贪心算法求解。我们采用审:暈最轻者先装的贪心选择策略，由此叫产生 
最优装载问题的一个最优解。具体算法描述 如下： 

• _ • 

■ 

template < class Typft > 

void Loatlin^Unl Type w_] ， TyptM、hit n) 

I 

int M = new int [n + 1 」； 

Sort( Yi, L, n); 

fur (int i = 1; i < = t 、； i + + > 

x : i ] = 0; 


for (int i = 1; i < = » & & wL t [ i ] ] < = (，； i + + ) ! 
x[l[i 」 ]=1; 

c - - w [ t [ i ]]; ! 


2. 贪心选择性质 


设集装箱已依其重髮从小到大排序 ，（〜 ，^，…，〜）是最优装载问题的一个最优解。乂设 
k - min 丨/ I & = 1 U 易知，如果给定的最优装载问题有解，则1 ^ ^ ^ ^ c 

0 )k k =〖时， U ,, h ， …，心）是一个满足贪心选择性质的最优解。 

(2) 当 k > 1 时，取 yi = 1» yk = 0 ;yj = xi ，\ < i n f l ^ k,M 


ti 

y, 


w in 


―“ .. 

^ ] " + S W i X i ^ E ^'iXi ^ ^ 


因此， （> I , > 2 ， …, h ) 是所给最优装载问题的一个可行解。 


另一方面， rt!^ Vi = &^,知，（ ?1 ， >2 ，..，，》)是一个满足贪心选择性质的最优解。所以, 
最优装载问题贪心选择件质。 


3. 最优子结构性质 

设 Ua ， …， &) 是最优装载问题的一个满足贪心选择性质的最优解，则易知，々=1， 
&,.••，〜）是轮船载軍讀为 r 〜 i 丘待装船集装箱为12, 3，，-， 〃 丨时相应最优装载问题的一 
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个最优 解：也 就是说，最优装栽问题 iw 』 最优+结构性质。 

由最优装载问题的贪心选择性质和最优子结构性质，容易证明算法 Loading 的正确性。 
算汰 Loading 的主要计算 M 在于将集装箱依其重 M 从小到大排庁，故耆法叽 W 的〖 I 算时 
间为 0( " log ")。 

4.4 哈夫曼编码 

哈夫曼编码是用于数据文件压缩的 ▲个十分奋 效的编码方法 f ，其压缩宇通常在2()% ~ 
90 % 之间 c 哈夫曼编码算法使用一个字符在文件中出现的频率表来建立一个用 0，1 中表 / j ■、各 
字符的最优表示方式。假设有一个数据文件包含〗00 000个字符，我们耍用「玉缩的方式來 fr 储 
它。该文件中各字符出现的频率如表 4-1 所示 c 文件 屮共有6个+同字符出现符 a 出现 
45 000次，字符 b 出现13 000次等。 


表 4-1 字符出现的频率表 



■■■ 



d 


频乎(千次） 

! 

45 

► 

• •• ■ 祖 / 1^4 1 

13 


16 


定长码 

W • • » • • w ■ • 1 

000 

001 


on 



变长码 


101 


mam 




要压缩表示这个文件中的信息有多种方法。我们考虑用0,1码串表示字符 的方法 ，即每个 


宁符用惟一的…个 0， i 串来农示,，若使用定长码，则表示每个不冋的字符需要3 位 : a = 000, 
b = 001 ,…， f = 101。用这种方法对整个文件进行编码需要300 000位。我们能否做得更好些 
呢?使用变长码要比使用定长码好得多。通过给出现频率髙的字符较短的编码，出现频率较低 
的字符以较长的编码，可以大大缩短总码位。表4-】给出了一种变长码编码方案 。其中 ，下符 a 
用一位串0表示，时字符 f 用4位串1100表示。用这种编码//案，整个文件的总码长为#5 x 1 
+ 13 x 3 + 12 x 3 + 16 x 3 + 9 x 4 + 5 x 4) x i 000 = 224 000位。它比用定长码方案好，总吗 
长减少约25% :事实上，这是该文件的一个最优编码方案。 

1. 前缀码 

我们对每一个字符规定一个0,1串作为其代码,并要求任一宁符的代码都不是其他字符代 
码的前缀。我们称这样的编码具有前缀性质，或简称为前缀码。编码的前缀性质吋以使译 码力去 
非常简单。由于任-字符的代码都不是其他字符代码的前缀，从编码文件中不断取出代表災一字 
符的前缀码,转换为原字符，即可逐个译出文件屮的所冇字符。例如表 4] 中的变长码就是种前 
缀码。对于给定的0,1串001011101可惟一地分解为0,0,101,1101,因而其译码为 aal^o 

译码过程需要方便地取出编码的前缀，因此需要_ * 个表示前缀码的合适的数据结构/为此 
目的，我们可以用二叉树作为盼缀编码的数据结构。在表示的缀码的二叉树中，树叶代衷给定 
的字符，并将每个字符的前缀码看作是从树根到代表该字符的树叶的一条道路。代码中每一位 
的0或1分别作为指示某结点到左儿子或右儿子的“路标”例如 [¥1 4-3 中的两棵二义树足 

表 4-1 中两种编码方案所对应的数据结构。 

容易看出，表示最优编码方案所对应的前缀码的二叉树总是一棵宂全_:叉树，即树4任一 
结点都有2个儿子。而定长编码方案不足最优的，其编码二叉树 小是一 棵完全一叉树 。在股 
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0 


0 



( a ) 



m 



图 4-3 前缀码的二叉辋表示 

情况下，若 C 是编码字符集，则 表示其 最优前缀码的二叉树中恰有 I C I 个叶子 2 每个叶子对应 
于字符集中一个字符，且该二叉树恰有 I C I - 1个内部结点。 

给定编码字符集 C 及其频率分布/，即 C 中任一字符 c 以频率 /( c ) 在数据文件中出现。 C 
的一个前缀码编码方案对应于一棵二叉树7\7 符 c 在树 r 巾的深度记为 rf r U )。 心 U ) 也是 
字符 r 的前缀码 

该编码方案的平均码长定义为70 = ^] fic ) d T (ch 

r €<、 

使平均码长达到最小的前缀码编码方案称为 C 的-个最优前缀码。 


2. 构造哈夫曼编码 


哈夫曼提出了一种构造最优前缀码的贪心算法，由此产生的编码方案称为哈夫曼算法。哈 
夫曼算法以 A 底叻卜_的方式构造表示最优前缀码的二叉树 r。 算法以 I c j 个叶结点开始，执 
行1 c I- 1次的“合并”运算后产生最终所要求的树7\下面所给出的算法心如抓丁旣中，编 
码字符集屮每一字符 c 的频率是 /U)。 以/为键值的优先队列 <2用以在作贪心选择时有效地 
确定算法当前要合并的两棵具有最小频率的树。一旦两棵 W 有最小频率的树合并后，产生一棵 
新的树，其频率为合并的两棵树的频率之和，并将新树插人优先队列 
算法屮用到的类 HufTmim 定义 如下： 


template < class Type > 
class Huffman J 

friend Binary Tree < int > Huff manT ree( T ype [ 」， int); 
public : 

operator Type O cond | return weightj \ 
private ： 

Binary Tree < int > tree; 

Type weight; 
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算法 HuiimanTree 描述如下: 


LernplciLe < class I vp^ > 

BinaiyTree < int > HuffmanTrec( Typc f[ J, int n) 


// 生成申纟 s 点树 


IluFfman < Type > w = new Huffman < Type > [" + 1 :: 
Binary Tree < ini > z ， zero; 
for (int i = 1 ； i < = n ； i + +) i 
l. MakeTree(i, zero^ zero ); 


w[ij. weight - f[ij ； 
w[i] . tret、= z; 


// 建优先队列 

M in Heap < Huffman < Type > > Q( 1); 
y. 1 nitialize( w ， n, ii); 

// 反复合 并最小 频率树 

Huffman < Type > x, y; 
for (int i=l;i<n;i + + )< 
y.DdeteMin(x); 

Q. DeleteMin(y); 
z- MakeTree(0 1 x. tree, v.tree); 
x. weight + = y. weight; x.tree = z; 
y _ Insert( x); 


Q. Deactivate 。； 
delete [] w; 

return x. irttt; 


算法 HuffmanTree 首先用字符集中每一宁符 c 的频率 /( r ) 初始 化优宄 队列 (? 。然后不 
断地从优先队列0中取出具有最小频率的两棵树 x 和 y ， 将它们合并为一棵新树的频率 
是％和 7 的频率之和。新树 z 以 z 为其左儿子， y 为其右儿子。(也可以 y 为其左儿子4为其右 
儿子。不同的次序将产生不同的编码方案，但平均码长是相同 的。） 经过 n - 1次的合并后，优 
先队列中只剩下一棵树，即所要求的树7 1 。 

算法 HuffmanTree 用最小堆来实现优先队列（?。初始化优先队列需要 0 U ) 计算时间，由 
于 DeleleMin 和 Insert 只需 0 (Logn ) 时间， - 1次的合并总共需要 0( ) 计算时间。因此， 

关于 n 个字符的哈夫曼算法的计算时间为 (nWognh 

对于表 4 M 中的例子,哈大曼算法的执行过程如图 4-4 所示。 
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(c) 


(d) 



( e ) 



( f ) 


图 4-4 哈夫曼算法执行过程 

由于字符集中有 6 个字符，优先队列的初始大小为6。总共用5次合并得到最终的编码 
树7%每次合并使优先队列 p 的大小减1。最终得到的树 r 即表示哈夫曼算法得到的最优前缀 
码——哈夫曼编码。每个字符的编码由树 r 的根到该字符的路径上各边的标号所组成, 

a = 0 ,b = 101 3 c = 100 , d r ： lll，e = 1101 ,f = 1100。 

3. 哈夫曼算法的正确性 

要证明哈夫曼算法的正确性，只 要证明 最优前缀码问题具有贪心选择性质和最优子结构 
性质。 

(1) 贪心选择性质 

设 C 是编码字符集， C 中字符 c 的频率为 / U ) 。又设$和是(:中具有最小频率的两个字 
符，则存在 C 的一个最优前缀码使; c 和 y 具有相同码长 R 仅最后一位编码不同。 

证明:设二叉树 r 表示 C 的任意一个最优前缀码。我们要证明可以对 r 作适当修改后得 
到一棵新的二叉树 r ， 使得在新树中，％和7是最深叶子 E 为兄弟。同时新树 r 表示的前缀码 
也是 c 的一个最优前缀码。如果我们能做到这一点 ，则％ 和^在 r 表示的最优前缀码中就具 
有相同的码长且仅最后一位编码不同。 

设6和 c 是二叉树 r 的最深叶子且为兄弟。不失一般性，可设 /( b ) ^ ^ 
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/() )C [tl 于 I 和 y 是 (； 中具小频率的两个宇符，故 /( A ：) 矣 y ) ^ /'( c ),. 

我们首先在树 r 中交换叶 了^ 和 a •的位置得到树 r ， 然后在树 r 中再交换叶子 c 和、•的 
位置，得到树广。如图 4-5 所示 c 

? V /•" 



^ >， 



图 4-5 编码树 r 的变换 

由此可知，树 r 和 r 表示的前缀码的平均码长之差为 

B ( T ) - B(D = y , f { c ) d T ( c ) - Yjf ( c ) d r ( c ) 

c€. C r€ <■ 

= f ( x ) d r ( x ) + /( b ) d T ( b ) - f ( x ) d r ( x ) - f { b ) d r ( b ) 

=/( x ) d T ( x ) f { b ) d T (b ) - /( x ) d T { b ) - f ( b ) d T ( x ) 

=(/( i ) - f ( x ))( d T ( b ) - d r ( x )) ^ 0 

最后一个不等式是因为 f{b) -/(^) 和 d T (b) - d T (x) 均为非负。 

类 7 以地，可以证明在 r 中交换 Y Sc 的位置也不增加平均码长，即 B(r)- b (D 也是 
非负的。由此可知忍 （r) 系 b(D ^ B(n。 另一方面，由于 r 所表示的前缀码是最优的，故 
b ( t ) /?(广）。因此，扒 r) = 0(7〃），即 r 表示的前缀码也是最优前缀码， a^； 和^具有 
最长的码长，间时仅最后 • •位编码不同。 

(2) 最优子结构件质 

设 r 是表示字符集 c 的一个邊优前缀码的完全二叉树。 c 中字符的出现频率为 /( c )。 设 
%和 y 是树 r 中的两个叶子 R 为兄弟^是它们的父亲。若将 z 看作是具有频率 /(:) : /U) 
+ /( y ) 的字符，则树 r = t - U,y! 表示字符集 c f = c - ；x, r | U 的一个最优前 
缀码。 

证明: 我们酋先证明 r 的平均码长忍 （r) 可用 r 的平均码氐 s(r) 来表示： 

事实上，对任意 6 C - k , v__ 有 d r (c) = d r (c) ， 槪 f{c)d T {c) = f{c)d r (c 、 ' 

另 一 Jf | fi { , <2 r ( x ) = d T ( y ) :- d r ( z ) + 1 ， 故 

/( x ) d T ( x ) + f ( y ) d T ( y ) = ( f ( x ) + f ( y ))( tl r ( z ) + 1) 

=/(-^ ) + /(r) + /( z ) d r ( z ) 

由 此即知 ，扒 n = B ( r ) + f ( x ) ^ f { y ). 

若 r 所表示的字符集 c 的前缀码+是最优的，则有 r 表示的 c 的前缀码使得衫 （ 7") < 
B ( r)。 由于 z 被看作是 r 中的一个字符，故 z 在 r 中是一树叶。若将％和 y 加人树 r 中作 
为 z 的儿子，则得到表示字符集（:的前缀码的二叉树 r'j=i 有 

b( : D = B(r) + fix) + /(v) 

< B ( r ) + fix ) + /( y ) = B ( T ) 

这与 r 的最优件不盾。故 r 所表示的 c' 的前缀码是最优的。 

由贪心选择性质和最优 T 结构件质立即可推 出：哈 夫曼算法是正确的， SP HuffiminTree 产 
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牛 C 的| * 棵最优前缀编码树。 


4.5 单源最短路径 

给定一个带权有向图 G = (F,E), 其中每条边的权是一个非负实数 c 另外，还给定V’中 
的一个顶点，称为源。现在我们要计算从源到所有其他各顶点的最短路长度.:这黾路的长度楚 
指路上各边权之和。这个问题通常称为单源最短路径问题。 

1 . 算法基本思想 

Dijkstm 算法是解单源最短路径问题的一个贪心算法:其基本思想是，设置一个顶点集合 
S 并不断地作贪心选择来扩充这个集合。一个顶点属于集合 S 当且仅当从源到该顶点的最短 
路径 K 度已知 。初始时， S 中仅含有源。设认是(；的某一个顶点，我们把从源到^且屮间只经过 
S 中顶点的路称为从源到 u 的特殊路径，并用数组 dist 来记录当前每个顶点所对应的最短特殊 
路径长度。 Dijkstra 算法每次从 V - S 中取出具有最短特殊路长度的顶点 W ，将添加到 S 中， 
同时对数组 dist 作必要的修改 。一 R S 包含了所有 K 中顶点， dh 就记录 了从源到所有其他顶 
点之间的最短路径长度。 

Dijkstm 算法可描述如下，其中输入的带权有向图是 (； = ( V \ E) y V = ll ，2, …， d ， 顶点 
V 是源 0C 是一个二维数 m ， C [(][ y ] 表示边 U ,/) 的权。当 （ D ) $ 瓦时， C [(][ y ] 是一个大数。 
dist [ i ] 表示当前从源到顶点纟的最短特殊路径长度。 

^ - j - • • • • • . • • • • ， m % 4 • • • r k • 

template < class Type > 

void Dijkstra(int njnt v, Type distf ]，int prev[ ] , Type * ^ c) 
i// 单源最短路径问题的 Dijkstra 算法 

bool sLmaxint]; 

for (int i = 1; i < - n; i + + ) | 
dist[ij = c[ v j [ i]; 
s[i] = false; 

if (dist[i] = = maxint) prev[_i」= 0; 
elseprev[i 」 =v; 

I 

J 

dist[v] = 0; s[v] = true; 

for (int i = 1; i < n; i + + ) ? 
int temp ^ maxint; 
int u - v; 

for (int j = I;j < = n；j + + ) 

if (( !^Lj]) & & (dist[j] < temp)) | 
u = j; 

temp = distLj 」； 
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s[u] - true; 

for (int j = Uj < - n;j + + ) 

if (( !s[jj ) &&(o[u][j] < maxint)) J 






Typc n^wciifit = dist[ n] -f d uj Lj I ； 
if (newdisl < dist[jj) 

^lisl[j] = newdisti 
prevLj] = m ； 


例如，对图 4-6 中的有向图，应用 Dijkstm 算法 i 十算从源顶点 1 到其他顶点间最短路社的过 
程列在表 4-2 中。 


表 4-2 Dijkstra 算法的迭代过程 


迭代 

■Eg 


dial [2] 


distl.4] 

ii 

f/ist[5 1 

初始 



10 

maxint 30 

100 




10 

60 

• 

30 

100 


M 

10 

50 

30 

90 

mgm 

<i，2,4,3[ 


10 

50 

30 

60 




10 、• 50 

30 

60 


上述 Dijke ^ a 算法只求出从源顶点到其他顶点间的最短路 
径长度:如果还要求出相应的最短路径，可以用算法中数组 prev 
记录的信息求出相应的最短路径。算法中数组 prevj ] 记录的是 
从源到顶点 i 的最短路径上/的前一个顶点。初始时，对所有 
i ^ U 置 prev [/] = 在 Dijkstra 算法中更新最短路径长度时， 

只要 dist [“] + c [ u ][ j ] < dist [纟]时，就置 prev [ i ] = 当 
Dijkstm 算法终止时，就可以根据数组 P rev 找到从源到/的最短 3)4-6 一 个带权有向图 
路径上每个®点的前一个顶点，从而找到从源到〖的最短路径。 

例如，对于阁 4-6 中的有向图，经 Dijkstm 算法计算后可得数组 prev 具有值 p rev [2] = 1， 
prev [3] = 4. p rev [4] = l t prev [5] . 3。如果要找出顶点 1 到顶点 5 的最短路径，吋以从数组 
pr^v 得到顶点5的前一个顶点是3,3的前一个顶点是4,4的前〜个顶点是1。 T 是从顶点1到 
顶点5的最短路径是1，4,3,5。 

2. 算法的正确性和计算复杂性 

下面我们来讨论 Dijkstra 算法的正确性和计算复杂性 D 

(1) 贪心选择性质 

D 】 jkstm 算法是应用贪心算法设计策略的又一个典型例子:它所作的贪心选择是从 V、 J 
中选择具有最短特殊路径的顶点^从而确定从源到 u 的最短路径长度 dh [ u ]。 这种贪心选 
择为什么能导致最优解呢?换句话说，为什么从源到 u 没有更短的其他路径呢?事实上，如果存 
在一条从源到 a E 长度比 did a ] 更短的路，设这条路初次走出 S 之外到达的顷点为 x € 
V - S ， 然后徘徊于 S 内外若十次，最后离开 S 到达^如图 4-7 所示。 

在这条路径 t ，分别记以 rx ) , rf 〈: c ,幻和 t ; , a ) 为顶点〃到顶点 x ，顶点: r 到顶点 W 
和顶点 V 到顶点 u 的路长，那么，我们有 
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dist_ .x ； ] ^ d(v , x) 

d ( v ， x ) + d(x f u ) = d(v , u ) < clis! [ h ] 

利用边权的非负性，可知 d ( x ， u ) 备0,从而推得如 l[;r j < 此为矛盾。这就 证明 

了 dist[ U ] 是从源到顶点〃的最短路径长度。 

( 2 ) 最优子结构件质 

要完成 Dijkstm 算法止确性的证明，我们还必须证明最优子结构性质，即算法屮确定的 
di S t[ M 确实是当前从源到顶点 U 的最短特殊路径长度..力此，我们只要考察算法在添加《到5 
中后 ，也 t、] 的值所起的变化就行了。我们将添加 a 之前的、 S 称为老的 S。 当添加了 ^之后，可 
能出现一条到顶点；的新的特殊路。如果这条新特殊路足先经过老的 S 到达顶点心然后从^ 
经一条边直接到达顶点则这种路的最短的 K 度是 disl[ W ] + du][i] f 这时，如果 dislU] + 
c[ u][ i] < dist[;] ， 则算法中用 dist: ii] + c[ w 」 [」] 作为 disO] 的新值。如果这条新特殊路径 
经过老的 S 到达 ix 后，不是从^/经一条边直接到达〖，而是像图 4-8 那样，回到老的 S 中某个顶 
点心最后才到达顶点“那么由于 at 在老的 S 中,因此: t 比《先加人心故图 4-8 中从源到X 
的路的长度比从源到 u， 再从^ 到％ 的路的 氏度小 。于是当前 db[〖] 的值小于 m 4-8 中从源经 
x 到 （ 的路的 K 度，也小于图中从源经^和^最后到达 f 的路的长度。因此，我们在算法中不 
必考虑这种路 。由 此即知，不论算法中 dislU] 的值是否有变化，它总足关 T 当前顶点集 S 到顶 
点^的最短特殊路径长度。 



图 4-7 从源到 w 的最短路径 图44非最短的特殊路径 

(3) 计算复杂性 

对于一个具有〃个顶点和 e 条边的带权有向图，如果用带权邻接矩阵表示这个图，那么 
DijUtra 算法的主循环体需要 0( a ) 时间。这个循环需要执行 n - 〗次，所以完成循环需要 
0( n 2 ) 时间。算法的其余部分所需要时间不超过0 (/ T 2 )。 

4.6 最小生成树 

设 (； = ( V ， E ) 是一个无向连通带权图，即一个 网络。 A ’ 中每条边 U ， w ) 的权为 
wk 如果 C 的一个子图 G ' 是一棵包含 C 的所有顶点的树，则称为 C 的生成树。生成 
树上各边权的总和称为该生成树的耗费。在 G 的所有生成树中，耗费最小的生成树称为 C 的 
最小生成树。 

网络的最小牛成树在实际中有广泛应用„例如，在设计通信网络时，用图的顶点表示城市, 
用边 U ， 的权 d !；][ w ] 表示建立城市〃和城市《；之间的通信线路所需的费用，则最小生 
成树就给出了建立通信网络的最经济的方案。 

1 . 最小生成树的性质 


用贪心算法设计策略可以设计出构造最小生成树的有效算法。本节中要介绍的构造最小 
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生成树的 Prim 算法和 Kmskal 算法都可以看作是应用贪心算法设计策略的典型例子。尽管这 
两个算&做贪心选择的方式不同，伹它们都利用了下面的最小生成树 性质： 

设 c = ( 1，也）是一个连通带权阉，是 v 的一个真子集。、如果 e i / e 
e v - [/， 且在所有这样的边屮， （ u , iO 的权 c [ u ][ 〃] 最小,那么一定存在 g 的一棵最小生 
成树，它以 U ，〃） 为其中一条边。这个性质有时也称为 MST 性质。 MST 性质可证明如下。 

假设 G 的仟何一棵最小生成树都不弇边 U ， r ) 。将边 U ， W 添加到 C 的-棵 最小生 ，成树 
T 上，将产生一个含有边 U ， tO 的圈，并且在这个圈 
L 有一条小 1司于的边 U 、 tO . 使得^ 6「， 

〆6 v - f/， 如图 4-9 所示。 

将边 U '， 〆 ） 删去，得到 C 的妁一棵生成树7% 

由于 c [ u ][ i ；] 在 c [ 〆 ][ 〆 ],所以 r 的耗费$ r 的 
耗费。于是 r 是，-棵含有边 u ， r ) 的最小生成树，这 图4-9含边 U ，,,） 的圈 

与假设矛病^ 

2. Prim 算法 

设 G = ( K,£) 是一个连通带权图， P =丨1，2,…，》丨。构造 C 的一棵最小生成树的 Prim 
算法的基本思 想是: 首先置 S = )1;，然后，只要 S 是 F 的真子集，就作如下的贪心选择 :选取 
满足条件 i e sj e v - 5,. a c [/][ y ] 最小的边，并将顶点添加到 s 中。这个过程一直进 
行到 s = f 时为止。在这个过程中选取到的所有边恰好构成 c 的一棵最小生成树。算法描述 
如下： 



void Prim(inl n^Type * * c) 

I 

i 

T = 0 ； 

S ^ 111; 
whik (8!= V) J 

(i ， j) = S 且 V - S 的最小 权边 ; 

T = T U 

S = S IJ ij;; 



算法结束时， 7 中包含 G 的 n - l 条边。利用最小生成树性质 
和数学归纳法容易证明,上述算法中的边集合^始终包含 e 的某 
棵最小生成树中的边。因此，在算法结束时， r 中的所有边构成 c 
的一棵最小生成树。 

例如，对于图 4-10 中的带权图，按 PrUii 算法选取边的过程如 
图 4- 11所示。 

在上述 Prim 算法中，我们还应当考虑如何有效地找出满足条 
件 i & S , j ^ V - S，R 权 C [i][y] 最小的边 （hj), 实现这个 U 的 
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(a) (b) <c> 



o 



图 4-U Prim 算法选边过程 

的 … 个较简单的办法是设置两个数组 dosest 和对于每一个 y - 5, do S est[>]£-；■ 
在 S 中的一个邻接顶点， 它与 ； 在 S 中的其他邻接顶点 A 相比较有 c{y][closest[；]] ^ 
c[jl[ /c] O lowcoat[j 的值就是 c[j][ closest [_/]] 。 

在 Prim 算法执行过程中，先找出 k - S 中使 lowuost 值最小的顶点 j, 然后根据数组 closest 
选取边 (_/ , closesl[ > ]) ，最后将 / 添加到 S 中，并对 closest 和 lowcost 作必要的修改。 

用这个办法实现的 Prim 算法可描述如下，其中， c • 是一个二维数组， [ 乃表示边 （〖， ; _) 
的权。 

• • * § • • ^ • • • • • • • J • • 

template < class Type > 
void Prim(int n $ Type * * c) 

I 

■ i 

Type lowest, maxint]; 
int closest[ maxint J : 
bool s[maxirit]; 

s[ 1 ] - true; 

for (int i = 2j i < - i + + ) ! 

Iowoost[i J = c[l][i ]； 
closest[i] = 1; 
s[i] - false; 

i 

for (int i = 1; i < nj i + + ) ' 

Type min = inf; 
int j - 1; 

for (int k = 2 ; k < = nj k + +) 

if ((lowoostLkJ < min) & & ( !sLkJ)) i 
min = lowcost [k]; 

j = k; 

cout < < j < < ； ' < < clos^estjl < < endl; 
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^1 j I = true; 

for (int k = 2 ; k < ^ n; k + +) 

if((c[j] ： k] < lowcost[k_')&^(! s |k])) ^ 
Iowcost|_fcJ 二 <vjjL ； 
close^l.[k n = j ； 


易知， h 述算法 Prim 所需的计算时间为 0 ( n 2 ) 

3.Kmskal 算法 

构造最小牛成树的另一个常用算法是 Kmskal 算法。.当图的边数为 e 时， Kruskal 算法所需 
的时间是 0 (eluge )、 ••当 e =： rt 2 ) 时， Kruskai 算法比 Prim 算法索，但:当 f " 2 ) 时， Kmskal 

算法却比 Prim 算法好得多。 

给定无向连通带权图 C = (V ,£), V - |1，2，"、糾泳，1^算法构造 （； 的最小生成树 
的基本思想是:首先将 G 的; I 个顶点看成 a 个孤立的连通分支，将所有的边按权从小到大排 
序。然后从第一条边幵始，依边权递增的顺序查看每一条边，并按下述方法迮接两个不同的连 
通分支 :当查 看到第条边 （ 时，如果端点 r 和 w 分別是当前两个不同的连通分支 ri 和 
T 2 中的顶点时,就用边 U ， 将 n 和 T 2 连接成一个连通分支，然后继续查肴第 A + 1 条边; 
如果端点 〃和 w 在当前的同一个连通分支中，就直接再查看笫 A + 〖条边.这个过程 一 K 进行 
到只剩下一个连通分支时为止。此时，这个连通分支就是 C 的〜棵最小生成树 

例如，对图 4-10 中的连通带权图，按 Knukal 算法顺序得到的最小生成树上的边如图 4-12 
所示。 



IS 4 -12 Kruskal 算法选边过程 

关于集合的一呰基本运算可用于实现 KmsU [算法。 Kmskal 算法中按权的递增顺序杏看 
的边的序列可以看作是一个优先队列，它的优先级即为边权。顺序杏看就是对这个优先队列执 
行 DeleteMin 运算。我们可以用堆来实现这个优先队列。 

另外，在 Kruskal 算法中，还要对一个由连通分支组成的集合不断进行修改.将这个由述通 
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分支组成的集合 C 为则需要用到的集合的基本运 箅有： 

(1) Union ( a ,6): 将£/中两个连通分支 u 和6连接起来，所得的结果称为4或 

(2) FindU ): 返回中包含顶点〃的连通分支的名字。这个运算用来确定某条边的两个 
端点所属的连通分支。 

这些基本运算实际上是抽象数据类型并查集 Union Find 所支持的基木运算,、 

利用优先队列和并查集这两个抽象数据类型可实现 Kruskal 算法 如下： 

template < class Type > 

t 

class EdgeNode \ 

friend ostream & operalfir < < (oslream& 1 EdgeNode < Type > ); 

friend bool Kmskal(intJnt,EdgeNode < Type > 》 .EdgeNode < Type > * ); 

friend void niairi( voiil); 

public ： 

operator Type () const I return weight; \ 
private r 

Type weight; 



templaie < nl^ss Type > 

bool Kruskal(int n,int e T EdgeNode < Type > K[]^ Bd^dVode < Type > tl L ].) 

I 

MinHeap < KdgeMode < Type > > H(l )； 

H.lTihialize(E ， e ， e )； 

Union Find U(n); 

int k = 0; 

while (e & & k < n - l) | 

EdgeNode < int > 

H.DdeteMin(x )； 
e ; 

int a = U.Find(x,u); 
int b = L". Find( x. v); 
if (a ! = b) \ 

t[k + + ] = x; 

L - Union(a, b); I 
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Deactivate 0 ; 

return (k = = n - 1); 



设输入的连通带权阁 《 ie 条边，则将这些边依其权组成优先队列需要 0( e ) 时间。在上述 
算法的 while 循环巾， DeliHeMin 运算需要 O ( Uge ) 时间，因此关于优先队歹[，所作运算的时间为 
O ( eloge )。 实现 UnionFind 所需的时间为 O ( eloge ) 或 0 (^ log * e )。 所以 KruskaL 算法所需的计 

算时间为 

4.7 多机调度问题 


设有〃个独立的作业 ii ，2, …，《丨，由 m 台相 N 的机器 进行加 丄处理。作业 i 所需的处理 
时间为 h 现约定，仟何作业可以在任 M —台机器 t ： 加工处埋，但未完 T _ 前不允许屮断处理。任 
何作业不能拆分成更小的子作业 C 

多机阔度问题要求给出一种作业调度^案，使所给的 a 个作业在尽可能短的时间内由 m 
台机器加工处理完成。 

这个问题坫一个 NP 完全问题，到目前为止还没有一个有效的解法。对于这一类问题，用 
贪心选择策略有时可以设计出较好的近似算法。采用最长处理时间作业优先的贪心选择策略 
町以设计出解多机调度问题的较好的近似算法。按此策略•当〃在 m 时，只要将机器 i 的 
[0,0]时间区间分配 给作 、 Ik ( 即可。 

当 n > m 时，首先将 n 个作业依其所需的处理时间从大到小排序。然后依此顺序将作业 
分配给空闲的处理机。 

实现该策略的贪心算法 Greedy 可描述 如下： 


class JobNode I 

friend void Job Node ^ , int, int )； 

friend void main(\oid); 


public t 

operator int () const | return time; \ 
private ： 

i【U ID ， 




rlass MachineNode I 

friend vuid Greedy(JobNtKle ^ . int, int); 

w 

public ： 

operator int () const i return avail; i 
private ： 

int ID, 

avail; 
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template < class Typo > 

void Creedy(Ty[X ； a、]，irit ii, iut in) 

I 

I 

if (n < = m) i 

cout < < 〃为 每个作业分配 • 台机器 / < < endi; 

return; ! 

Sort(a ， n) ; 

MitiHeap < MathinelVodp > H( in )； 

MachineNcxIc x; 

for (ini i = l;i< = rn; i + + ) I 
x. avail = 0 ； 

x，ID = i; 

H.lnsert(x )； 

I 

for (int i = n; i > = 1; i — ) i 
H. DeleteMin(x); 

cout < < "将机器 < < xJD < < " 从 " 

< < x. avail < < "到 w 

< < (x.avail + a[i, ♦ time) 

< < " 的时间段分配给 作业〃 < < aLiJ.ID < < tndl; 

x.avail + - a[ij. time; 

H. Insert(x); 


当备 w 时算法 Greedy 需要 0(1) 时间。 
当汀> m 时，排序耗时 OUlogn)。 初始化 
堆需要 0 ( m ) 时间。关于堆的 Delete Min fD 
Insert 运算共耗时0 ( ralog m 〉，因此算法 Greedy 

6 11 15 17 所需的计算时间为 

图4 -13 多机调度示例 0( nlog?i + ^ilogm) = 0 ( n \ ogn ) 

例如，设7个独立作业 U ，2,3,4,5,6,7| 由3台机器,财 2 和仰 3 来加工处理。各作业所 
需的处理时间分别为!2,14,4，16,6,5,3丨。按算法(；1^办产生的作业调度如图4 -13 所示，所 
需的加 T： 时间为17。 



4.8 贪心算法的理论基础 

借助于一个称为“拟阵”的丄具，我们可以建立一个关于贪心算法的较一般的理论。这个 
理论在确定何时使用贪心算法可以得到问题的整体最优解时十分有用。 
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1 .拟阵 


一 个拟阵 M 定义为满足下面三个条件的有序对 （ s ，/) : 

(1) S 足一个非空有限集. 

(2) /是 S 的一类具有遗传性质的独立子集族，即若打 G /，则 S 是6’的独 立了集 ，丘 i / 的 
任意子集也都是 S 的独立子集，空集0必为 f 的一个成员。 

(3) / 满足交换性质，即若 .4€/，公€/且141<丨5 I ，则存在某一元素 x ^ n - A , 
使得4 U U 丨6 h 

例如，设 S 是一给定矩阵中行向暈的集合，/是 S 的线性独立子集族，则由线性空间理论 
容易证明（6’，/)是一拟阵。 

拟阵的另一个例子是无向图 （； = ( F ,£) 的图拟阵=(心^心八其中”^定义为罔。 
的边集£： 。心 定义为心的无循环边集族。 B 卩 A ^ 1 0 当且仅当它在阁 C 中构成一个森林、 

依此定义，=(心， / e ) 是一个拟阵。事实上，心= E 是一个有限集。由于从心的一个 
无循环边集中去掉若干边不会产生循环，即森林的任一子集还是森林，因此心 H 有遗传性®。 
进一步，我们还吋证明&满足交换性质。设4和 B 是图 G 的两个森林且丨以> M 丨，即4和 
B 都足无循环边集，且 B 中的边数比4多。由于图 （； 中有 A 条边的森林恰由 I !/ I - A •棵树组 
成。(从 C 中丨1/丨个顶点组成的森林开始，每增加一条边就减少一棵树因此森林 S 中的树 
比森林 .4 中的树少。由此可推出森林5屮存在一棵树7\它的顶点在森林,4的不同的两棵树 
中。又由于树 r 是连通的，故 r 中必有一边 （ u ， t ；) 使得顶点1/和〃在森林4的不同的两棵树 
中。将此边加人森林4不会产生循环。因此 ，心 满足交换性质。由此即知-个拟 
阵。 

给定一个拟阵 M = (6 T ，/)， 对于/中的一个独立子集4 £ /，若 S 有•♦元素使得 
将; r 加人4后仍保持独立性，即 .4 u M e /,则称 z 为/ 1 的一个可扩展元素。 

例如，在图拟阵中，若4是 -个独 立边集，则边 e 是^4的-.个可扩展元素是指边 f 不 
在4中，且将边 e 加人4不会产牛循环。 

当拟阵 M 中的一个独立子集4没有可扩展元素时，称4为一个极大独子集。换句话说， 
3 A 不被 M 中别的独4子集包含时，4就是一个极大独立子集。下向的关于极大独 (/: 子兔的 
性质是很有用的。 

定理 4.1 拟阵 M 中所有极大独立子集具有相同大小 c 

证明♦•用反证法。设4和忍是 M 的极大独立子集，且 j 忍 I > I ^ I 。由拟阵的交换性喷推 
出,存在某一元素 b - a 使得 a u u 丨 e /。这与4是极大独立子集相矛盾 。冋理 ，丨 J I 
<15 1也将导致矛盾，故 M 丨= I 尺 U 

在关于无向图 （； 的图拟阵 A /。 中，心的一个极大独立子集是连接图 （； 屮所冇顶点旦有 
I V I - 1条边的自由树。这种树就是图 G 的生成树。 

若对拟阵 W == (5,/) 中的 S 指定一个权函数阶，使得对于任意 a ： €心有 W ( x ) > 0 T 
则称拟阵3 /为带 权拟阵。依此权函数的任一子集4的权定义为 『 M ) = I > u )。 

例如，在图拟阵中，定义 W ( e ) 为边 e 的长度，则 『 U ) 是边集_4中戶无有边的 I 〈度 
之和 o 
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2. 关于带权拟阵的贪心算法 


许多可以用贪心算汰•求解的问题可以表不为求带权拟阵的最大权独立子集问题。即给定 
一个带权拟阵 M =(心/)，要确定5的一个独.、>.子集4 6 /使得把 M ) 达到最大。这种使 
W ( A ) 最大的独立子集_4称为拟阵 M 的一个最优子集。由于 S 屮仟一元素 I 的权『（幻是正 
的，因此，最优子集也一定是极人独立子集。 

例如，在最小生成树问题中，我们要找出无叫图0 = ( F ，£) 的一棵生成树，使该树各边 
长之和达到最小。其中各边的边由边长函数『给出。这个问题可以表示为确定带权拟阵 
的一个最优子集问题。其中，^是图 （； 的图拟阵， R 权函数 1 T 定义为 ITU ) = W , - 

犯(> 是比 C 中最大边长还大的一个正数<： Me 中每一极大独立子集 A 相应于图 C 中一 
棵生成树，& W f ( A ) = (I K 卜 l ) r Q - F (4) 。因此，使权 IT M) 最大的独立子集 4 必使 
阶 （4) 达到最小。即带权的最优子集与图的最小生成树之间存在 一一 对应关系。 
由此可知，求带权拟阵的最优 T 集4的算法可用于解最小生成树问题 c 

下面给出一个求带权拟阵最优子集的贪心算法。该算法以具有正权函数见的带权拟阵 
M = (5, /) 作为输入,经计算后输出 M 的一个最优子集 


template < class Type > 

Type Greedy(M,W) 

I 

A - 0; 

将 S 中元素依权 W 值大的优先组织成一个优先 队列; 
while (S! = 0) I 

S. Delete Max(x); 

if {A U Ul e 0 A = AU Ui ； 


return A 


算法 Greedy 以贪心选择的方式，按权值从大到小的次序依次考虑 iS 中元素^当; r 是4的 
—个可扩展元素时，就将^加人独立集4中，否则舍弃^由拟阵的定义，空集是独立的，而且 
在算法中仅当4 U U; 是独立集时才将X加人.4,故由归纳法即知4总是独立的。因此，算法 
Greedy 返回的子集4足独、>:子集。稍后我们将看到4是具宥最大权的独立子集。因此，/!是一 
个最优于集。 

算法 Greedy 的计算时间吋分为两部分来分析。 

设^ = I S I。将 S 中元素依权值大的优先组织成-个优先队列，并对它进行"次 
IMeteMax 运算只需要 0(nbgrO 计算时间。若检测 /I U M 是否独立需要 0(/U)) 计算时 
间，则将 S 中所有元素检测一遍需要的计算时间为0("/(幻）。因此，算法 Greedy 的计算时间 
复杂性为 O ( n\ogn + nf { n))o 

下面我们来证明算法 Greedy 的正确性，即它返回的独立子集」足 M 的一个最优子集， 

▼ 

引理 4.1 (拟阵的贪心选择性质） 
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设似=(心/)圮具有权函数 W 的一个带权拟阵， US 中元索依权值从人到小排列。又设 
^ € ^是^屮第-个使得 Ui 是独立子集的兀素，则存在 S 的一个最优子集4使得 X & Ac 
证明 :若不 存在 ; t e sim \ x \ 是独 立了集 ，则引埋是平凡的。设 B 是一个非空的最悅子 
^集。由 r-Be /， n _/ 具有遗传性，故#中所有中•个元素>组成的子均为独立子集。又由 

于; C 是 S 中的第•一个单元素独立子集，故对任意的 >• G s 均有： W ( x ) ^ R /( v) c 

^ _ 

若 I 则只要令 /I =仏定理得 证;； Sj 冬/?，我们将构造包含几素: C 的最优子集 
一开始，设4 = id . 此时 M 是‘个独立子集。若丨5 1 = 141= 1，则定理得证。否则，必有 
\ B \>\ A I c 反复利用拟阵 M 的交换性质 ，从丑 屮选择一个新元素加人 .4 中并保持4的独 
立性，直至 I B \^ \ A h 此时，必灯一元素方且:使得4 = B - jyi U U 1。 由此 
知 

^'(.4) = \ V ( B ) - W { y ) + W ( x ) ^ W ( R ) 

另一方向又由于沒是一个最优子集，故4 W ( B ) ^ 『 U ).， 因此， W ( A ) = W ( B ) y 5\] A 
也是一个最优子集 ， R ^ £ /lc 

算法 Greedy 茌作贪心选择构造最优子集4时， 昏次选 入集合4屮的元素 x 是单兀 S 独立 
集屮具有最大权的兀素:此时吋能已经舍弃了 S 中部分元紊。我们要证明这些被舍弃的儿素 
永远不可能用于构造最优子集。 

引理 4.2 设 M = ( S ，/) 是一个拟阵。若 S 中元素 X 不娃空集 0 的一个可扩展兀素，则 
^也不可能是 S 中任一独立子集4的一个可扩展元素。 

证 明：用 反证法。设$ e S 不是0的一个可扩展元素，但它是 S 的独立子集 .4 的一个町扩 
展元素 ， Efi a u u 丨 e /。由/的遗传性又可推出 u 丨是独立的。这与％不是空集 0 的一个可 
扩展元素相矛硏,、 

由引理 4.2 即知，算法 Greedy 在初始化独立子集4时所舍弃的元素可以永远舍弃。 

引理 4.3 (拟阵的最优子结构性质） 

设 x 是求带权拟阵 A / = ( SJ ) 的最优子集的贪心算法0枕#所选择的 S 中的第一个元 
素。那么，原问题可简化为求带权拟阵= ( S ', n 的最优子集问题，其中 

S f = ! v I y G S R 1 ^, r ! f /1 
尸二！丨且打 

M f 的权函数 M 似的权函数在 y h 的限制(称 ir 为 M 关于兀素: r 的收缩）。 

证 明:若 4是 M 的包含兀素; C 的最大权独立子集，则 i - \ x \\ lw 的一个独立子 
集。反之， 1T 的仟一独立子集 r 产生 M 的一个独立子集4 1 u UU 在这两种情肜下均 

W ( A ) ^ F (4')+ FU )。 因此 M 的包含元素 X 的最优子集包含 AT 的一个最优子集，反 
之亦然。 

定理 4.2 (带权拟阵贪心算法的止确性） 

设 M = (5,/) 是一个具有权函数取的带权拟阵，则算法 Greedy 返回⑽的一个最优 
子集。 

证明：由引理4,1知,若算法 Greedy 第一次选择加入4的兀素是^则必存在包含元素;^ 
的一个最优子集。因此， Greedy 的第一次选择是正确的。由引理 4. 2知，选择^吋 Greedy 所舍弃 
的兀素不时能是任一最优子集屮的兀素.因此，这些元素可以永远舍弃。最后，由引理4,3知， 
Greedv 选择了儿素; r 后，原问题简化为求拟阵，的最优子集问题。由 T 对于 AT 中仟一独立 
子集 B 6厂均有 B U M 中足独\>:的。因此, Greedy 选择了元素; t; S， 其后继步骤可以 
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看作是对拟阵 at = (义 ， r ) 进行计算的。 「 h 归纳法即知，其后继步骤求出 Ar 的一个最优子 
集，从而算法 Greedy 最终求出的足 M 的▲个最优子集。 

3. 任务时间表问题 


一 个单位吋间仟务足怡要 •• •个单位时间来宂成的任务 : 给定一个单位时间任务的有 
限集 心关于 S 的一个叫间表用于描述 S 中申位时间任务的执行次序。时间表中第1个任务从 
时 W 0开始执行直至时间〗结屮，第 2 个任务从时间1开始执行至时问2结束，…，第^个任务 
从时间 n - 1开始执行直至时间 a 结束。 

具有截止时间和误时惩罚的单位时间任务时间表问题可描述如下。 

问题的 输人： 

(1) tz 个单位时间任务的集合5 = 11,2^-,^ , 

(2) 任务；的截止时间<(，1 ^ i ^ n A d t ^ "，要 求任务 i 在时问之前结束。 

(3) 任务丨的误时惩罚 w } A ^ I ^ 、任务/未在时问4之前结束将招致％的惩罚；若 
按时完成则无惩罚。 

仟务时间表问题要求确定 S 的•个时间表(最优时间表）使得总误时惩罚达到最小。这个 
问题看上去很复杂，然而借助于拟阵，我们可以用带权拟阵的贪心算法有效地求解。对于一个 
给定的 S 的时间表，其中在截止时间之前完成的任务称为及吋仟务，在截止时间之后完成的 
任务称为误时任务。我们可以将^的任一时间表调整成为及时优先的形式，即其中所有及时 
任务先于误时任务，而不影响原时间表中各任务的及时或误时性质。事实上，若时间表中及时 
任务I跟在误时任务 y 之后，则交换 x 和7在时间表中的位置不会影响二者的及时或误时性 
质。通过若十次的这种交换即可将原 时间表 调整成为及时优先的形式。 

类似地，还可将 S 的任一时间表调整成为规范形式，其中及时任务先于误时任务，且及时 
任务依其截止时间的非减序排列 。首尤 可将时 间表凋 整为及时优先形式，然后再进一步调整及 
时任务的次序。在时间表中，若冇两个及时任务（和 ; •分别在时间&和时间 A + I 完成且 
dj < <，则交换纟与 y 在时间表中的位置。由于在交换前任务 j 是及时的，故 A + 1 各 << 4。 

因此在交换 ft 置后^ 1 <心即仟务；仍是及时任务。任务；在时间表屮位置前移，故交换位 
置后任务/也是及时的。由此可知，这种交换不影响任务丨和任务 ） 的及时性质。经过若干次交 
换即可将时间表调整成为规范形式。 

通过以卜_的分析吋以看出，任务时间表问题可等价 f 确定最优时间表中及时仟务子集4 
的问题。一旦确定了及时任务子集将4中各任务依其截止时间的非减序列出，然后再以任 
意次序列出误时任务， SP S - A 中各任务，由此产生 S 的一个规范的最优时 间表。 

设4 ^是一个 ff 务子集 。茗有 一 个时间表使得4中所有任务都是及时的，则称 A 为 S 
的一个独立任务子集:显然，3的任 时 间表屮及时任务构成的集合均为^的独立任务子集。 

记/为 S 的所有独立任务+集所构成的集合。 

对时间 r = K 2, …， 〃，设 A _\(/0 是仟务子集中所冇截止时 N 是 f 或赵早的任务数。我 

们来考虑如何判断仟务子集4的独立性。 

引理 4.4 对于 S 的任一任务了•集 A ，下面的各命题是等价的。 

(1) 任务子集4是独立 子集。 

(2) 对于 f = 1，2 •…， n_ 都有 A ) to 

(3) 若,4中任务依其截止时间非减序排列，则_4中听有仟务都是及时的 
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证明 ： （ 1)^(2): 若任务集 4 是独立的 ，且存 在某个〖使 得」 V f M) > /• ，则 ,4 中仏多 ft 个 
任务要在时间 r 之前完成，显然这足办不到的。故 4 中必冇误时任务。这是独 4 ：任务子集 
矛盾。因此，对所有 r = 1 ， 2,… ， n 有 /V_,U) 矣 Q 

(2)4(3) : 若 4 中仟务依其截止时间的非减序排列，则 (2) 屮不等式意味宥排序后 4 中第 
I 个任务的截止时间在时间〖之后。故排庁后 4 中所有任务都是及时的。 

(3 〉 :=^(1): 显而易见:； 

引理 4.4 中的性质 (2) 可用于有效地判断一个给定的任务子集的独 . 、 >: 性。 

任务时间表问题要求使总误时惩罚达到最小，而这等价于使任务时间表中的及时任务的 
惩罚值之和达到最大。下面的定理使我们能用带权拟阵上的贪心算法求出总惩罚最大的独 .、乂 
任务子集 4 。 

引理 4,5 设 S 是带有截止时间的单位时间任务集， / 是 S 的所有独立仟务？集构成的集 
合。则有序对（ 5, /) 是一个拟阵。 

证明 : 独立任务集的子集显然也是独立子集。故 / 满足遗传性质。下面证明 （S ,i ) 满足交 
换性质。 

设4和 B 为两个独立任务子集&丨 B 丨 > 丨/4 |。设 A = max U 丨/ \ r t ( B ) ^ / V f ( 4 ) 丨。由于 
= I 公丨 ， A ^ U ) = 丨，而1丑 I >丨4丨 ， 即 ^ n ( B ) > 因此必有友< n ,a 

对于满足 A + n 的 j 有 N ' B ) > ~(4)。取尤 e B - A Rx 的截止时间为左 + U 令 

1 4 U hU 我们来证明，是独立的。 

事实上，由于4是独立的，故对1备〖备 k ^ N t ( A f ) = N t { A ) ^ L 又由于5是独立的， 
故对< £矣 ；1 有 _/ V,(D = / V “/ l ) 十1矣 !\ t ( B ) ^ 由引理4. 4 即知 / T 是独立的。综上 
所述即知，（5, /) 是一个拟阵。 

由定理 4. 2 可知用带权拟阵的贪心算法可以求得最大权 ( 惩罚）独立任务子集以 ,4 作 
为最优时间表中的及时任务子集，容易构造一个最优时间表。 

用于求解任务时间表问题的贪心算法的计算时间复杂性是 OUlogn + n/U)) 。 其中， 
/( 幻是用于检测任务子集 4 的独立性所需的计算时间 。 用引理 4. 4 中性质 (2 ) 容易设计一个 
0U) 时间算法来检测任务子集的独立性。因此，整个算法的计算时间为 0( 一)。具体算法 
Greedyjob 可描述如下。其中， d[i],l $〖$ 〃，是 n. 个单位时间任务的截止时间.且个单位 
时间任务已依其误时惩罚的非增序 排列。 JU] 是最优解中的第 / 个任务。 


ini Greedyioh(ini n 9 int d[ ]，int J[ j) 


d[0] = 0;j[0] = 0; 

int k - 1; 

JLU = u 

for (int i = 2;i < = ri;i + +) i 
int r = k; 

while ((dtJLr]] > tlLij) & & (d'.Jf rj J! = r)) 
r = r - i; 

if ((^Lllr]] < - d[i])&&(d[i] > r)) i 
for (irtt m - k;m > r;m — ) 


m • 



JLr + 1 J = i : 



return k? 


例如，给定单位 吋间 任务集 s 及各任务的截止吋间和误时惩罚 如下: 



■ 


■ 

MM 

n 

■ 

du. ! 
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mm 

r - ■> 
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60 
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'1 

10 


算法 Greedyjcih 先选择仟务1,2,3,4,然后舍弃仟务5,6，最后再选择任务7。算法求得的 
最优时 间表为 i2,4.1，3,7,5,6U 其总误时惩罚为 w [ 5 ] 4 - w [ 6 ] = 50,达到最小。 


用 抽象数据类型并丧集 LnionFind 可对上述算法作进 - 步改进。采用相同的贪心选择策 
略来选择任务。为了给后继任务留下尽吋能大的选择空间，在选择了 任务〗 时，将[0,1]， 
[1，2]， …， [</ t - 1 ， 沁]中最右端的空闲时间区间分配给任务 〖。任 何-个最优时间表最多只能 
安排& = minj / z , max | <丨丨个及时任务。为方便起见，直接用 i 来表示时间区间 - I ，，以 

i n 

0表示左端空闲区间：-1，0]。设~衣 tk 小 f 或等于 （ 的最右端空闲区间.则化在〖。我们将时 
间区间划分为一些等价类。时间区间 i 和 j •属于 同一等 价类当且仅当 A = '。该 等价类就以~ 
命名。初始时有0,〗， …， 6共6 + 1个等价类。要安排截止吋间为^的仟务，先用 Find 找到含有 
时间区间 min ] n , d \ 的等价类 I 就表 7 K 叫以安排当前任务的最心端的那个空闲时间区间 。 
安排完之后，等价类 t 就应4含有时间区间 h 〜 1的等价类用 Unicm 合并 。 

改进后的算法 Kaftterjoh 描述如下： 

k % / • • 參 * * / • • • _ • • • ^ • • 

int FasterJob(int n，int J[]) 

I 

參 

I 

int * F = new int [ r) + 1 _; 

(or (ini i = 0; i < 二 i!; i + +) i 」 =i; 

Union Find U(ii) j 

int k - 0; 

for (int i=l;i< = n;i + + ) i 

int m = (n < cl ： ij) ?U. Find(n) : L, Find(dLiJ); 
if (F[m] > 0)) 

k - k + 1; 

J[k] - i ； 

int t = L\ FincK Ff mj - 1); 

L-. Union( L m); 

HmJ = F[t J; 
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return k; 


算法 Fasldob 用到的 Find 和 L _ num 运算的次数都不超过 a 次丙此，如果不计预处理的 
时间，算法 Fasterjoh 所需的计算时间为 Oinlo ^ n ) 

习题4 

44 假设我们要在足够多的会场里安排一批活动，并希望使用尽吋能少的会场 r 设计 一 
个有效的贪心算法来进行安排(这个问题实际 ll 是著名 的阁着 色问题。若将每一个活动 作为图 
的一个顶点，不相容的活动间用边相连。则使相邻顶点着有不同颜色的最小着色数，就相应于 
我们要找的最 / h 会场数)。 

4-2 在活动安排问题屮，还可以有其他的贪心选择方案，但并不能保证产生最优解。给 
出一个例子，说明若选择具有最短时段的相容活动作为贪心选择，得不到最优解。若选择覆盖 
未选择活动最少的相容活动作为贪心选择，也得不到最优解。 

4-3 证明背包问题具有贪心选择性质。 

4-4 若在 0-1 背包问题中，各物品依電量递增排列时，其价值恰好依递减序排列。对这个 
特殊的 0-1 背包问题，设计一个有效算法找出最优解，并说明算法的正确性。 

心5 给定 k 个排好序的有序序列 ; , ^ ，…， ^，现要用2路合并算法将这 A 个序列合沣成 
一个有序序列。假设所采用的2路合并算法合并两个长度分别为 m 和《的序列需要 m + n - 1 
次比较。试设计-一个算法确定合并这个序列的最优合并顺序，使得所需的总比较次数最少， 

4^6设有〃个程序 U、2, …， d 要存敗在长度为 L 的磁带上。程序 i 存放在磁带 Jt 的长 
度是 U S 纟矣心如果将这 n 个程序 按“， / 2 ,…， L 的次序存放，则读取卜程序所需的时间 

与 S &成正比。这汀个程序的平均读取时间为 （ 2 tr )/ n , 

磁 带最优存储问题要求确定这 n 个程序在磁^ I ：的一个存储次序，使平均读取时间达到 
最小 e 试设计 • -个解此问题的算法，并分析算法的正确性和计算复杂性。 

4^7设有《个文件/, ， j \ ，…'“ 要求存放在一个磁盘上，每个文件占磁盘 .L 1个磁 M > 

这 n 个文件的检索概率分别是/^，/^，〜，/^，且£/^ = k 磁头从当前磁道移到被检信息磁 

道所需的时间町用这两个磁道之间的校向距离来&量。如果文件乃存放在第 t 道上，1 $ I 、 
则检索这《.个文件的期望时间是 S ^/>//(~)。其中， W /， 乃是第^道与第）道之间的 

】矣^ < j 令 n 

径向距离。 

磁盘文件的最优 存储问 题要求确定这 n 个文件 在磁盘 t 的忭储位置，使期望检索时间达 
到最小 c 试设计一个解此问题的算法，并分析算法的正确性与计算复杂性。 

4-8 设 … ，&是 要存放在一条长度为 L 的磁带 h 的 u 个程序:每个程序&听需 

的带长为化。如果乂叫矣 L ， 则所有的程序都能放在〜条磁带 i .。 如果假定» > 要求找 
出这些程序的最大子集使得屮的程序能存放在一条磁带上 。 其中最大子集^的定义是 
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Q 中包括的程序个数锒多。 

(1) 设&的顺序满足〜< a 2 系…备 d -个求最大子集<?的算法。要求输出结果是 
数组 S。 如果程序 Pi r±Q 中，则 s[/] = 1;否则 < i] = 0。 

(2) 证明你设汁的算法能保证找到 /n ^2, 的使$ /. 的最大子集 CU 

t '€0 

(3〉设是按匕面的策略得到的最大子集，磁带的利用率（ T .^/ L 有多大？ 

P 户 Q 

(4) 假定现在的 H 标是要求磁带的利用率最大，而程序以的顺序满足 h 会…多〜。 
要求按 P 卜 P 2, …， pr ： 的顺序来考虑选取 / a 到 G 中，只要磁带上的剩余空间足够容纳就 
应当把外选入 (> 中。按以上策略写一个箅法并分析其时间和空间复杂性 。 

(5) 证明按 (4) 的策略所得到的子集未必能使带的利用率达到最大。利用率能小到什么程 
度?试证明你设计的算法的界。 

4-9 问题的条件如上题，现在的目标是:①使子集 （？ 达到 最大; ②在保证 （> 最大的前 
提下使带的利用率达到最大。应当采用什么策略? WIIV ■•个完整的算法并证明其正确性。 

4-10 假定要把长为 h ，/ 2 , 的^个程序放在磁带。和 r 2 上 ，并辻 希望按照使最 
大检索时间取最小值的方式存放，即如果存放在6和 h 上的程序集合分别是4和仏则希望 

所选择的4和尺使得 ma X {^ X，SU 取最小值。一种得到 J 和方的贪心算法如下:开始将4 

i€ A l(rB 

和5都初始化为空，然后一次考虑一个程序，如果，则将当前正在考 

iC A ^ .4 fi 

虑的那个程序分配给4，否则分配给办。证明无论是按 - ^ K 或是按 h 多，2彡… 
》 l n 的次序来考虑程序，这种方法都不能产生最优解^应当采用什么策略?写出一个完整的算 
法并证明其正确性。 

4-11 设有 n 个顾客同时等待一项服务 c 顾客 〖需要 的服务时间为 ~,1 备/安 n, 应如何 
安排71个顾客的服务次序才能使总的等待时间达到最小?总的等待时间是每个顾客等待服务 
时间的总和。 

4-12 在上题中.如果有处提供同一服务,应如何安排 " 个顾客的服务次序？ 

4-13 将最优装载问题的贪心算法推广到2艘船的情形，贪心算法仍能产生最优解吗？ 
4-14 设 r 是一棵带权树，树的每一条边带一个正权。又设 S 足 r 的顶点集， 7V5 是从 
树 r 中将 s 中顶点删去后得到的森林 jn 果 r/s 中所有树的从根到叶的路长都不超过必则称 
7V 5 是一个森林， 

(1) 设计一个算法求 r 的一个最小®点集 s. 使 r/5’ 是一个^森林(提系 ：从叶 向根移 

动) c 

(2) 分析算法的正确性和计算复杂性。 

(3) 设 r 中有^个顶点，则算法的计算时间复杂性应为 OU)。 

4-15 将任务安排问题的贪心算法推广到完成任务丨需要 C 吋问的情形，1 安 i 免 n 。 
(16 —辆汽车加满油后可行驶 n 千米 ，旅途 中奋若十个加油站。若要使沿途加油次数 
最少，设计一个冇效算法，指出应在哪些加油站停餚加油并证明你的算法能产生一个最优解。 

4-17 设 ，…， x n 是实直线上的^个点。若要用单位 K 度的闭区间去覆盖这 n 个 
点，至少需要多少个这样的 单位闭 区问？设计 * 个哲效算法解此问题，并证明算法的正确性。 
4-18 字符 a 〜 h 出现的频率恰好坫前8个 Fibonacci 数，它们的哈夫曼编码是什么?将结 
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果推广到 《 个字符的频率恰好是前^个 Fibonacci 数的情形. 

4'19 设= |0，1，"_， ? 1 - [ \ lAn 个字符的集合。证明关 C 的任何最优前缀码可以 
表示为长度为 2" - 1 + «「 U > gn ] 位的编码序列 J 提 示:用 2〃 - 1位来描述树结构。） 

4-20 将哈夫曼算法推广到 K 元码的情形(即用0,1和2进行编码），并证明算法吋产生 
最优三元码。 

4-21 说明如何用引理 4.4 的性质(2)，在0(丨 J I )时间里确定给定的任务集4是否独 
立 D 

4-22 给定••个《 x «实值矩阵 r ， 证明 （ s ，/) 是一个 拟阵其 中，^娃 r 的列向量的集 
合 ，/I 6 /当且仅当4中的列是线件独 立的： 

4-23 说明如何变换带权拟阵的权函数，使得求最小权最大独立子集问题变换为等价的 
标准带权拟阵问题，并证明变换的止确性。 

4-24 考虑下向的用最少硬03个数找出 n 分钱的问题。 

( 1 ) 当使用 2 角5分，1角，5分和1分4种硬币面值时，设计一个找 a 分钱的贪心算法，并 
证明算法能产4: -个最优解。 

(2) 假设 wj 使用的硬币面值足 c ' c 1 , … T c ft ，其中， c 足一正整数且 c > \、 k 名 1。证明在这 
种情况下，贪心算法总能产生最优解。 

(3) 给出…个贪心算法不能产生最优解的硬币面值集合： 

4-25 给定一个 a 位止整数 a ， 太掉其 中任意 An 个数字肟,剩下的数字按原次序排列 
组成一个新的正整数。对于给定的 n 位正整数 a 和 IH 整数/^，设计-个算法找出剩下数字组成 
的新数最小的删数方案。 

4-26 在黑板上写了 n 个正数组成的一个数列，进行如下 操作: 每一次擦去其中两个数 
设为《和6,然后在数列屮加人一个数6 + ]，如此下去直至黑板卜.只剩下一个数 c 在所有 
按这种操作方式最后得到的数中，最大的数 E 为 max , 最小的数记为 min ， 则该数列的极差¥ 
定义为 M = max - min 。 对于给定的数列，设计一个有效算法计算出其极差对：并说明算法的 
正确性。 

4-27 假设具有《个顶点的连通带权图中所有边的权值均为从1到〃之间的整数，那么 
你能使 Kmskal 算法作何改进，时间复杂性能改进到何种程度?若对某常量 A , 所有边的权值 
均为从1 到乂 之间的整数，在这种情况下又如何？在上述两种情况下，对 Prim 算法能作何 
改进？ 

4-28 试设 i 卜-个构造图 （; 的生成树的算法，使得构造出的生成树的边的最大权值达到 
最小 C 

4-29 试举例说明如果允许带权有向图中某些边的权为负实数，则 Dijkstm 算法不能正 
确地求出从源到所有其他顶点的最短路径长度。 

4-30 设 （； 是一个具有 n 个®点和 e 条边的带权有向阁，各边的权值为0到 /V - 1之间 
的整数，~为一非负整数。修改 Dijkstra 算法使其能在0(如 + e ) 时间内计算出从源到所有其 
他顶点之间的最短路径长度。 

4-31 —个维箱 … ，〜）嵌人另一个 J 维箱 （ yi ， V2 ，…， h ) 是指，存在1，2, …， 
d 的一个排列 。使得 〜⑴ < yi ，， … ，<0 < yyv 

( l ) 证明 h 述箱嵌套关系具冇传递性。 - 
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⑵试设计一个有效算汰，用于确定 U 维箱是否叫嵌入 M —个^维箱。 

0) 给定由^个 d 维箱 m 成的集合化，心•…，扎1，试设 H —个 A 效算法找出这 n 个 J 维 
箱中的一个最长嵌套箱序列，并用〃和^来描述算法的计算时 间复 杂性。 

4-32 套 ft : 是指利用货币汇兑率的差异将一个单位的某种货币转换为大于一个单位的 
同种货币。例如，假定1美元可以夂 0.7 英镑，1英镑可以买 9. 5法郎，且1法郎可以买到 0.16 
美元。通过货币兑换 ，一 个商人4以从1美元开始买人，得到 0*7 x 9. 5 x 0,16 = 1.064 美元， 
从而获得64%的利润。 

假设已知 n 种货币 q ， c 2 , …， q 和侖关兑换率的， t x "丧心其中，丑[~]是一个单位货 
币 q 可以买到的货币&的单位数。 

(1) 试设计一个冇效算法，用以确定是否存在一货币序列使得 

R [ i \ J 2] R [ i 2, i 3]-* R [ ik , i \] > 1 

并分析算法的 H 算时间。 

(2) 试设计一个算法打印出满足 (1) 中条件的所冇序列，并分析算法的计算时间。 
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第 5 拿回溯法 


学习要点 

• 理解回溯法的深度优先搜索策略 
. 掌握用回溯法解题的算法 框架： 

(0 递归回溯最优予结构性质 

(2) 迭代回溯贪心选择性质 

(3) 子集树算法框架 

(4) 排列树算法框架 

• 通过下面的应用范例学习回溯法的设计 策略： 

(0 装载问题 

(2) 批处理作业调度 

(3) 符号三角形问题 

(4) n 后问题 

(5) 0 - 1背包问题 

(6) 最大团问题 

(7) 图的 m 着色问题 

(8) 旅行售货员问题 

(9) 圆排列问题 

(10) 电路板排列问题 

(11) 连续邮资问题 

回溯法冇“通用的解题法”之称。用它可以系统地搜索一个问题的所有解或任 _• 解。 K 溯 
法是一个既带有系统性又带有跳跃性的搜索算法。它在包含问题的 所布解 的解空问树屮，按照 
深度优先的策略，从根结点出发搜索解空间树。算法搜索至解空间树的仟一结点时，总是先判 
断该结点是否肯定不包含问题的解。如果肯定不包含，则跳过对以该结点为根的 了树的 系统搜 
索，逐戾向其祖先结点冋溯。否则，进入该子树，继续按深度优先的策略进行搜索.回溯法在用 
来求问题的所有解时，要回溯到根，且根结点的所有子树都匕被搜索遍才结束。而回溯法在用 
来求问题的任一解时，只要搜索到问题的一个解就可结束。这种以深度优先的方式系统地搜索 
问题的解的算法称为回溯法，它适用于解一些组合数较大的问题： 

5.1 回溯法的算法框架 


1. 问题的解空间 

应用回溯法解问题时，首先应明确定义问题的解空 I 问题的解空间应至少包含问题的- • 
个(最优）解 c 例如，对于有 u 种可选择物品的 0-1 背包问题，其解 空间由 长度为〃的 ()-1 向 fi 
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组成 3 该解空间包含了对变 tt 的所有可能的 0-1 赋值。当〃 = 3时，其解空间是 

K (}，0,0)，（( U ，0)，（0，()， l ),( l ，0,0)，（()， l ， l )，（ l ，0, l )，（ l ， l ，0)，（ i ， l ， l)i 
定义了问题的解空间后，还应将解空间很好地组织起来，使得用 M 溯汰能方便地搜索整个 
解空间。通常我们将解空间组织成树或图的形式。 

例如，对于 n = 3时的 0-1 背包问题，其解空间用一棵完全二叉树表示，如图 5-1 所示。 



图 5-1 0-1 背包问题的解空间树 

解空间树的第丨层到第 i + 1层边上的标号给出 了变置 的值。从树根到叶的任一路径表示 
解空间中的一个兀素。例如，从根结点到结点//的路径相应于解空间中的元素（1，1，1)。 

2. 回溯法的基本思想 

确定了解空间的组织结构后，回溯法就从开始结点(根结点）出发，以深度优先的方式搜 
索整个解空间。这个开始结点就成为一个活结点，同时也成为当前的扩展结点。在当前的扩展 
结点处，搜索向纵深方向移至一个新结点。这个新结点就成为一个新的活结点，并成为当前扩 
展结点。如果在当前的扩展结点处不能再向纵深方向移动，则当前的扩展结点就成为死结点。 
换句话说，这个结点不再是一个活结点。此时，应往回移动（回溯）至最近的一个活结点处，并 
使这个活结点成为当前的扩展结点。回溯法即以这种工作方式递归地在解空间中搜索，直至找 
到所要求的解或解空间中已无活结点时为止。 

例如，对于 n = 3时的 0-1 背包问题，考虑下面的具体 实例 ： w = [16,15,15],^ = [45, 
25,25 ]，c = 30。我们从图 5-1 的根结点开始搜索其解空间 。开 始时根结点是惟一的活结点，也 
是当前的扩展结点。在这个扩展结点处，我们可以沿纵深方向移至结点 B 或结点 C 。 假设我们 
选择先移至结点此时，结点4和结点 B 是活结点，结点 B 成为当前扩展结点。由于选取了 
，故在结点石处剩余背包容量是 r = 14,获取的价值为45。从结点 B 处，我们可以移至结点 

Z > 或^由于移至结点 Z ) 至少需要= 15的背包容量，而我们现在仅有的背包容量是 
r = 14,故移至结点 Z ) 导致一个+可行解。而搜索至结点瓦不需要背包容量，因而是可行的。 
从而我们选择移至结点五。此时』成为新的扩展结点，结点/!、/?和是活结点。在结点£处， 
r = 14,获取的价值为45。从结点£处，可以向纵深移至结点/或火。移至结点 J 导致一个不可 
行解，而移向结点尤是可行的，于是移向结点它成为一个新的扩展结点。由于结点 / C 是一 
个叶结点，故我们得到一个可行解。这个解相应的价值为的取值由根结点到叶结点 K 的 
路径所惟一确定 ，即％ = (1,0,0)。由于在结点尤处 d 不能再向纵 深扩搌 ，所以结点 K 成为死 
结点。我们返回到结点£处。此时在结点 E 处也没有可扩展的结点，它也成为死结点。 

接下来我们又返回到结点 S 处。结点忍同样也成为死结点，从而结点4再次成为当前扩 
展结点。结点4还可继续扩展，从而到达结点 C 。 此时 ， r = 30,获取的价值为0。从结点 <：我们 
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可移向结点 F 或假设我们移至结点 F , 它成为新的扩胺结点。结点4 C 和 F 足活结 点:在 
结点 Hr = 15,获取的价值为25。从结点 F ， 我们向纵深移至结点 L 处，此时 ，r = <)，获取 
的价值为50:、由于 L 是一个叶结点，而且是迄今为止找到的获取价值最卨的町行解，因此 C 录 
这个可行解。结点 A 小可扩展，我们又返回到结点 F 处。按此方式继续搜索，可搜索遍整个解 
空间。搜索结束后找到的最好解娃相应 0-1 背包问题的最优解。 

我们再看一个用回溯法解旅行售货员问题的例子。 

旅行售货员问题的提 法足: 某售货员要到若十城布去推销商品， U 知各城市之 H 的路程 
(或旅费)。他要选定一条从驻地出发，经过每个城市一遍，最后 [ ill 到驻地的路线，使总的路程 
(或总旅费）最小。 

问题刚提出时，不少人都认为这个问题很简单来，人们在实践中才逐步认识到，这个问 
题只是叙述简单，易于为人们所理解，而其计算复杂性却是问题的输入规模的指数函数。属于 
相当难解的问题之一。事实上，它是一个 NP 完全问题。这个问题可以用图论的语言来进行形 
式描述。 

设 G = ( F ， 五） 是一个带权图。图中各边的费用(权）为-正数。阁中的一条周游路线是包 
括 K 屮的每个顶点在内的一条回路。-条周游路线的费用是这条路线上所奋边的费用之和。 
所谓旅行售货员问题就是要在图 （； 中找出一条有最小费用的周游路线。 

给定一个有^个顶点的带权 fflC ， 旅行售货员问题要找出图 C 的费用(权）最小的周游路 
线。图 5-2 是一个4顶点无向带权图。顶点序列1，2,4,3，1; 1，3,2,4,丨和1，4,31是该图中 
3条不同的周游路线。 • 

该问题的解空间可以组织成一棵树，从树的根结点到任--叶结点的路径定义了图6、的一 
条周游路线。图 5-3 是当 n = 4时这种树结构的示例。其中从根结点,4到叶结点/：的路径卜_边 
的标号组成一条周游路线1,2,3,4,1。而从根结点4到叶结点0的路径则表示周游路线1，3, 
4,2,1。图 C 的每一条周游路线都恰好对应于解空间树中一条从根结点到叶结点的路径。因 
此，解空间树屮叶结点个数为 U - 1)!。 




图 5-2 4顶点带权图 阌 5-3 旅行售货员问题的解空间树 

对于图 5-2 屮的图 C ， 用回溯法找最小费用周游路线时，从解空间树的根结点4出发，搜 
索至在叶结点 L 处记录找到的周游路线1，2,3,4，1,该周游路线的费用为59。从 
叶结点 L 返回至最近活结点 F 处。由于 F 处 Q 没有可扩展结点，算法乂返问到结点 C 处。结点 
C 成为新扩展结点，由新扩展结点，算法 再移 至结点 G 后又移至结点 M ， 得到周游路线1,2,4, 
3, 1 ,其费用为66。这个费用不比已有周游路线1，2,3,4，1的费用史小。因此，舍弃该结点:算法 
乂依次返回至结点 C ， C ， 万。从结点算法继续搜索至结点/)，//，〜 .在叶结点 W 处，相应的 
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周游路线 1，3,2,4，1 的费用为25。它成为迄今为止找到的最好的一条周游路线。从结点八算 
法返回至结点好，然后冉从结点 D 开始继续向纵深搜索至结点0。依此方式算法继续搜索 
遍整个解空间，最终得到1,3,2,4，1是一条最小费用周游路线。 

在用回溯法搜索解空间树时，通常采用两种策略来避免无效捜索，提髙回溯法的搜索效 
率。其一是用约束函数在扩展结点处剪去不满足约朿的子树;其二是用限界函数剪去不能得到 
最优解的子树。这购类函数统称为剪枝函数。 

例如，在解 0-1 背包问题的回溯法中，用剪枝函 数剪去 导致不可行解的子树。在解旅行售 
货员问题的回溯法中，如果从根结点到当前扩展结点处的部分周游路线的费用已超过当前找 
到的最好的周游路线费用，则可以断定以该结点为根的子树中不含最优解，因此可将该子树 
剪去。 

综上所述，运用回溯法解题通常包含以下三个 步骤： 

(1) 针对所给问题，定义问题的解 空间； 

(2) 确定易于搜索的解空间 结构； 

(3) 以深度优先的方式搜索解空间，并且在搜索过程中用剪枝函数避免无效搜索。 


3.递归回溯 

由于回溯法是对解空间的深度优先搜索，因此在一般情况下可用递归函数来实现回溯法 
如下： 


void Backtrack(int t) 


if (t > n) Outpul(x); 
else 

for (int i = f(n ， t);i < = g(n^t);i + +) \ 
x[t] = K(i); 

if (Constraint(t) & & Baund(t)) Backtrack(t + 1) i 

I 


其中，形式参数 （ 表示递归深度，即当前扩展结点在解空间树中的深度。〃用来控制递归深度， 
即解空间树的高度。当！ > n 时，算法已搜索到一个叶结点。此时，由函数 OiapmU ) 对得到的 
可行解 X 进行记录或输出处理。算法 Backtrack 的 for 循环中 f ( a , i ) 和 g ( n ，0分别表示在当 
前扩展结点处未搜索过的子树的起始编号和终止编号。 h ( 0表示在当前扩展结点处 xU ] 的第 
i 个可选值。函数 Conslraint ( f ) 和 Bound { t ) 表 7 K 在当前扩展结点处的约束函数和限界函数。函 
数 Con S Uaint ( t ) 返回的值为 true 则表示在当前扩展结点处 x [ l ： f ] 的取值满足问题的约束条 
件，否则不满足问题的约束条件，可剪去相应的子树。函数 Bmmd ( f ) 返回的值为 mie 则表示在 
当前扩展结点处 x [ U ] 的取值尚未使目标函数越界，还需由 Backtrack(f + 1) 对其相应的子 
树作进一步 搜索。 否则，当前扩展结点处 x [ l ：/] 的取值已使目标函数越界，可剪去相应的子 
树。执行了算法的 for 循环后，已搜索遍当前扩展结点的所有未搜索过的子树。 Backtrack ⑴执 
行完毕，返回£ - 1层继续执行，对还没有测试过的 x[i - 1] 的值继续搜索。当 t = 1时，若已 
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测试完 x [1] 的所有可选值，外层凋用就全部结束。敁然，这一搜索过程是按深度优先的方式进 
行的。调用一次 Backtraok ( l ) 即吋完成整个回溯搜索过程。 

4. 迭代回溯 

如果采用树的非递归深度优先遍历算法，也可将回溯法表示为一个非递归的迭代过程 
如下： 


void IterativeBacktrack( void) 


int t = 1; 
while (I > 0)) 

if (f(n,t) < = g(n ， t)) 

for (int i = f(n,t);i < = g(n t t) ;i + + ) ^ 
xLt] = h(i); 

if (Confitraint(t) & &Bound(i)) | 
if ( Solution(l) ) Output(x); 

I + + ； I 

l 

I 

else t — ; 



在上述迭代回溯算法的描述屮，用函数 Soiution (0 判断在当前扩展结点处是否已得到问 
题的一个可行解 。函数 SoUitiorK 0返回的值为 true 则表示在当前扩展结点处 x[l ： t] 是问题的 
—个可行解。此时，由函数 OutputU ) 对得到的可行解 x 进行记 录或输出处理函数 
SohitionU ) 返回的值为 false 则表示在当前扩展结点处 x [ l ：^] 只是问题的-个部分解，还需向 
纵深方向继续搜索。算法中的函数和 g ( t 〖）分别表示在当前扩展结点处未搜索过的 
子树的起始编号和终止编号。 hU ) 表示在当前扩展结点处 x [ f ] 的第 f 个可选值。函数 
ConstraintU ) 和 BoundU ) 表示在当前扩展结点处的约束函数和限界函数 n 函数 Constraint : r ) 
返回的值为 true 则表示在当前扩展结点处 x [\： t ] 的取值满足问题的约束条件，否则不满足问 
题的约束条件，4剪去相应的子树。函数 Bound ( ^ ) 返回的值为 ime 则表示在当前扩展结点处 
x [ l ：^] 的取值尚未使 H 标函数越界，还需对其相应的子树作进一步搜索 。否则 ，当前扩展结点 
处 x [ l : d 的取值已使 n 标函数越界，可剪去相应的子树。算法的 While 循环结束后，完成整个 

回溯搜索过程。 

用回溯法解题的一个显著特征是问题的解空间是在搜索过程中动态产生的。在任何时刻， 
算法只保存从根结点到当前扩展结点的路牦。如果解空间树中从根结点到叶结点的最长路径 
的长度为 ZiU), 则冋 溯法所需的计算空间通常为 0 UU ))。 而显式地存储整个解空间则需要 
0(2 AU ) ) 或 0 UU )!) 的空间。 

5. 子 集树与排列树 

图 5-1 和图 5-3 中的两棵解空间树是用回溯法解题时常遇到的两类典型的解空间树： 
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当所给的问题是从 n 个元素的集合 S 屮找出满足某种性质的子集时，相位的解空间树称 
为子集树。例如，〃个物品的0 -1 背包问题所相应的解空间树就是一棵+集树。这类子集树通 
常有 2 "个叶结点，其结点总个数为2" +1 - 1。 遍历子集树的任何算法均需 r 3(2 R ) 的计算时间。 

当所给的问题是确定/ I 个元素满足某种性质的排列时，相应的解空间树称为排列树。排列 
树通常有〃!个叶 结点洇 此遍历排列树需要 m 〃！） 的计算时间。图 5-3 屮旅行售货员问题的 
解空间树就是一棵排列树 

用回溯法搜索子集树的一般算法可描述 如下： 


void Baoktraok(int l) 

J 

I 

if (l > «) Oulput(x); 
else 

for (int i = 0 ； i<-l ； i+ + )| 

xLtJ =： i; 

if (Constraint(t) & &Bound(t)) Backtrack(t + 1); 


用回溯法搜索排列树的算法框架可描述 如下： 

void Backtrack(int t) 

I 

if (t > n) Output(x); 
else 

for (int i = t;i<=n;i+ + ) I 
Swap(x[t], x[i]); 

if (Constraint ⑴ &&Bound(t〉) Backtrack(t + l); 
Swap(x[ 〖 ] ， x[i]); 


在调用 Backtrack ( l ) 执行回溯搜索之前，先将变量数组 x 初始化为单位排列 （1 ，2,…， n ) D 

5,2装载问题 

在第4章中我们讨论了最优装载问题的贪心算法。本节中讨论的装载问题是最优装载问 
题的一个变形。 

1. 问题描述 

有一批共〃个集装箱要装上2艘载重量分別为 Cl 和 c 2 的轮船，其屮集装箱 i 的重量为％, 
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^-^2 W 1 ^ c j + c 2» 

载问题要求确定，是否有一•个合理的装载方案可将这 ^ 个集装箱装 h 这2艘轮船。如果 
有，找 KS —种装载方案 。 

例如，当 n = 3, c] = c 2 = 50 ，且切= [10,40,40] 时，则可以将集装箱 i 和 2 装到第一艘 
轮船上，而将集装箱3装到第二艘轮船 h ; 如果 w = [20,40 ,40] ，则无 法将这3个集装箱都装 
上轮船。 

当 q +〜时，装载问题就等价于子集和问题。当 q = c 2 . Fli ] % ，则装载 
• 1 • 1 

问题等&于划分问题。 " 

即使限制 = 1，…， rr 为整数， q 和也是整数。子集和问题与划分问题都是 NP 难 
的。由此可知装载问题也是 NP 难的 3 

容易证明，如果一个给定的装载问题有解，则采用下面的策略可以得到一个最优装载 
方案。 

(】）首先将第一艘轮船尽可能装满； 

(2) 然后将剩余的集装箱装到第二艘轮船上。 

将第一艘轮船尽可能装满等价于选取全体集装箱的一个子集，使该子集中集装箱重量之 
和最接近由此可知,装载问题等价于以下特殊的 0-1 背包 问题： 

n 

max w $ Xi 

“l 

7k 

S w i x i ^ c \ 

i = l 

^ |0, I t ♦ 1 ^ t ^ ^ 

我们可以用第 3 章中讨论过的动态规划算法解这个特殊的 0-〗 背包问题。所需的计算时间 
是下面我们用回溯法设计一个解装载问题的 0(23 计算时间算法。在某些 
情况下该算法优于动态规划算法 C 

2. 算法设计 

用回溯法解装载问题时，用子集树表示其解空间显然是最合适的。用可行性约束函数可剪 
去不满足约束条件 i 在 Cl 的子树。在子集树的第 y + i 层的结点 z 处，用 CW 记当 前的装 

r = l 

9 

载重量，即 cw = ~时，以结点 Z 为根的子树中所有结点都不满足约束条 

件，因而该子树中 1 的解均为不可行解，故可将该子树剪去。 

在下面所给出的解装载问题的回溯法描述中，函数 Max Loading 返回不超过 c 的最大子集 
和，但并未给出达到这个最大子集和的相应子集。稍后将使其进一步完善。 

函数 MaxLoading 中调用递归函数 Backtrack ( l ) 实现对整个解空间的回溯搜索。 
Back track ( 0搜索子集树中第纟层子树。函数 Backtrack 是类 Loading 的成员。类 Loading 的其他 
成员记录子集树中结点信息，以减少传给函数 Backtrack 的参数。 cw 记录当时结点所相应的装 
载重量, bestw 记录当前已找到的最大装载重量 3 函数 MaxLmuling 负责类 Loading 的私有变量 
的初始化。 


• 123 , 



在函数 Backtrack 中，当 i > n 时,表承算法已搜索至一个叶结点，其相应的装载重量为 
cw 。 如果 cw > bestw ， 则表示当前解优于迄今所找到的最优解，此时应更新 bcstw 。 

当^时，当前扩展结点 Z 是子集树中的一个内部结点。该结点有 x [〖] =1和 x[d = 0 
两个儿子结点。其左儿子结点表示 x [0 = 1的情形，仅当 CW + w [ i ] 在 C 时迸入左子树，递归 
地对左子树进行搜索。其右儿子结点表示 X [〖] = 0的情形。由于可行结点的右儿子结点总是 
可行的，故进人右子树时不需检丧可行性。 

函数 Backtrack 动态地生成问题的解空间树。在毎个结点处算法花费 0(1) 时间。子集树中 
结点个数为0(2”，故 Backtrack 所需的计算时间为 0(2 n ): 另外 Backlmck 还需要额外的 
0 U ) 的递归桟空间 c 
具体算法可描述 如下： 

• • • • m _ • • • • _ • • _ _ _ _ 

template < class Type > 
class Loading i 

friend Type MaxLoading(Type !_] ， Type, int); 
private ： 

void Backtrack(int i); 

// 集装箱数 
// 集装箱重量数组 
//第艘轮船的载重量 
//当前载重量 
//当前最优载重量 


template < class Type > 

void Loading < Type > :: Backtraok( int i) 

u/ 搜索第 i 层结点 

if (i > n) I // 到达叶结点 

if (cw > bestw) bestw - cw; 
return;! 

// 搜索子树 

if (cw + w[i」< =c) |// x[i] = 1 
cw + - w[i]; 

Backtrack(i + 1); 
cw - = w[i] ； 1 

Backtrack(i + 1);// x [ i ] = 0 



template < class Type > 

Type Max Loading (Type w[]，T y j)e c y int n) 
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, v / 返回最优载重量 

Loading < Type > X; 

//初始化 X 

X, w - w; 

X,c = c; 

X.n - n; 

X^bestw = 0; 

X.cw = 0; 

// 计算最优载重量 

X. Backtrack{ i); 
return K.bestw; 


3. 上界函数 

对于前面所描述的算法 Backtrack ， 我们还可以引人一个上界函数，用于剪去不含最优解 
的子树，从而改进算法在平均情况下的运行效率。设 Z 是解空间树第 f 层上的当前扩展结点。 

cw 是当前载 重量; beslw 是当前最优载重量； r 是剩余集装箱的重量，即 r = ^，定义上界 

函数为 cvv + r 。 在以 Z 为根的子树中任一叶结点所相应的载重量均不超过 + ^因此，当 
cw + r ^ bestw 时，可将 Z 的右子树剪去。 

在下面的改进算法中，引人类 Loading 的一个私有变量 r ， 用于计算上界函数。引人 h 界函 
数后，在达到一个叶结点时就不必再检查该叶结点是否优于当前最优解。因为 h 界函数使算法 
搜索到的每个叶结点都是迄今为止找到的最优解 D 虽然改进后的算法的计算时间复杂性仍为 
0 (2” ，但在平均情况下改进后的算法检查的结点数较少。 

改进后的算法可描述如下： 


template < class Type > 
class Loading i 

friend Type MaxLoading( Type , Type, int); 
private : 

void Backtrack(int i); 

int m // 集装箱数 

Type* w ， // 集装箱重量数组 

c, // 第一艘轮船的载重量 

ow y //当前载重量 

bestw, //当前最优载重量 

r ; // 剩余集装箱重量 

I ； 
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template < class Type > 


n 




void Loading < Type > : : Bark track t irit i) 

;// 搜索第 i 层结点 

if(i > n ) ■，// 到达叶结点 

bestw = cw; 
return; : 

// 搜索 f 树 

r -= w[iji 

if (cw + w|_ij < 二 c) i// x[i 」 =1 
cw + - w.i]; 

Backtrack(i + 1); 
cw - ^ w[ij; \ 

if (cw + r > bestw) // x[ij = 0 
Backtrack(i + 1); 
r + = w[i]; 


template < clast Type > 

Type M ax Load in g( Type w[]，Type int n) 

!// 返回最优载重 a 

Loading < Type > X; 

// 初始化 x 
X.w = w; 

X.c ^ c; 

X.n - n; 

X-besfvv = 0; 

X.cw = 0; 

// 初始化「 

X.r = 0; 

for (int i = 1; i < = n; i + + ) 

X.r + = w[i]; 

// 计算最优载重贵 

X. Backtrack (1); 
return X J>estw; 


4 . 构造最优解 

为了最终构造出达到最优值的最优解，必须在算法中记录与当前最优值相应 f 当前最优 
解。为此，在类 Loading 中增加两个私有数据成员 x 和 be . tx 0 x 用于记录从根至当前结点的路 
径； , bestx 记录当前最优解。算法搜索到达一个叶结点处，就修正 bestx 的值。 

进一步改进后的算法可描述如下： 
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template < class T>pe > 

<Lias Loading ) 

friend Type MaxLoading(Type [!♦ Type, int，int L j )； 



private: 

void Backtrack t int i); 

i ， // 集装箱数 


mt 


bestx 


Type 


best w. 


// 当前解 
// 当前最优解 
// 集装箱重童数组 
// 第一艘轮船的载 w 量 
//当前载重量 
//当前最优载重量 
//剩余集装箱重量 


template < class Type > 

void Loading < Type > :: Backtrack(int i) 

I// 搜索第 i 层结点 

if(i > n) I // 到达叶结点 

if (cw > bestw) j for (j = 】 ； j < = n;j + + ) bestx[j] = x[j]; besiw - cw; 
return; i 

// 搜索子树 

r - = w[i]; 

if (cw + w[i] < - c) I// 捜索左子树 

x[i] - 1 ； 

cw + - w[i]; 

Bar ； ktrack(i + 1); 
cw - - w[ij;! 

if (cw + r > bestw) |// 搜索右子树 
x[i] = ◦; 

Backtrack (i + 1);[ 
r + = w[i]; 


template < class Type > 

Type Max Loading (Type w[ ] v Type (、ini n，int bestx[ J) 

I // 返回最优载重童 


Loading < Type > X; 

// 初始化 X 

X.x - new int [n + 1 ]; 
X. w =. w; 

X.c - c; 

X.n - n; 
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X.l>t^Lx = he^tx ； 

X.bestw = 0; 

X.«w = 0; 

// 初始化 r 
X.r = 0; 

for (int i - 1; i < = n; i + +) 
X.r + = w[i] \ 

X. Backtrack( 1); 
delete [ 」 X-x; 
return X.bestw; 


由于 b es u 可能被更新 0 ( 2 ” 次，故改进后算法的计算时间复杂性为0(/12〃）。 

我们可以采用下面的两种策略之一使改进后的算法的计算时间复杂性减至 
0) 首先运行只计算最优值的算法，计算出最优装载量研。由于该算法 不记录 最优解，故 
所需的计算时间为0(2”。然后再运行改进后的算法 Backtmck ， 并在算法中将 bestw 置为妒。 
这样一来，在首次到达的叶结点处(即首次遇到〖> a 时）终止算法。由此返回的 bestx 即为最 
优解。 

(2) 另一种策略是在算法中动态地更新 besu 。 在第 i 层的当前结点处，当前最优解由 
x[_/] ， 1 名^和 bestx[jr], i ^ ^ n 所组成 c 每当算法回溯一层时，将 x[f] 存人 bestx [€]。 

这样一来，在每个结点处更新 bestx 只需 0(1) 时间,从而整个算法中更新 bestx 所需的时间为 
0(2 n ) c 


5. 迭代回溯 


由于数组 x 记录了解空间树中从根到当前扩展结点的路径，这些信息已包含了回溯法在 
回溯时所需要的信息。因此利用数组 x 所含的信息，可将上述回溯法表示成非递归的形式。这 
样，可进一步省去 0 U ) 的递归栈空间。解装载问题的非递归的迭代回溯法 Max Lading 可描 
述如下： 


template < class Type > 

Type Max Loading (Type w[ ] ♦ Type int n，int bestxL 」） 

i // 迭代回溯法 

// 返回最优载重量及其相应解 
//初始化根结点 
ini i = 1; //当前层 
//x[l ： i- 1 ] 为当前路径 

int * x = new int [ n + 1 ]; 

Type bestw = 0, // 当 前最优载重量 
cw = 0, // 3 前载重童 
r = 0 ; // 剩余集装箱重童 

for (int j = 1; j < = n; j + + ) 
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// 搜索了树 

while (true) j 

while (i < - n & & cw + w[ij < = c) i 

// 进入左子树 

r ^ = w[ij; 
cw + - w[ i j; 

xLi] = 1 ； 

1 + + ; 

s 

if (i > n) I // 到达叶结点 

far (int j = 1; j < = n; j + + ) 
bestx|_[ = x[j]; 
bestw = cw; : 

else \// 进人右子树 

r - =： w[ij; 
x[i] = 0; 

i + + ; I 

while (cw + r < = bestw) I 

// 剪枝回溯 

i --; 

while (i > 0 && ! xLi ]) J 
// 从右子树返回 
r + = H'i]; 
i — ; 

I 

I 

if (i ^ = 0) I delete [ ] x; 
return bestw; \ 

// 进人右子树 

x[i] = Oi 

CH - - w[i]; 


算法 MaxLoading 所需的计算时间仍为 0 ( 2 n ) o 


5.3 批处理作业调度 


1 . 问題描述 

给定 n 个作业的集合/= U ， J 2 , …，人)。每一个作业丄都有两项仟务要分別在2台机器 

上完成。每一个作业必须先由机器1处理，然后再由机器2处理 3 作业人需要机器/•的处理时间 
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为 t”，i : = 1，2。 对于一个确定的作业调度，设 ~ •足 作业/ 在机器 y 上完成处理 

的时间。则所有作业在机器2 h 完成处理的时间和/ = 称为该作业调度的完成时 

以1 

间和。 

批处理作业调度问题要求对于给定的 n 个作业，制定一个最佳作业调度方案，使其完成时 
N 和达到最小。 

批处理作业调度问题的一个常见例子是在计算机系统中完成一批 n 个作业，每个作业都 
要完成先计算，然后将计算结果打印输出这两项任务。计算任务由计算机的中央处理器完成， 
打印输出任务由打印机完成。因此在这种情形下，计算机的中央处理器是机器1，打印机是机 
器2: 

对于批处理作业调度问题，可以证明，存在一个最佳作业调度使得在机器1和机器2上作 
业以相同次序完成。 

例如，考虑如下《 = 3的 实例： 


h ' 1 

机器1 

机器2 

作业 1 

2 

1 

作业 2 

3 

1 

作业 3 

2 

3 


这三个作业的6种可能的调度方案是1，2,3; 1,3,2; 2,1,3; 2,3,1； 3，1，2; 3,2,〗 ； 它们 
所相应的完成时间和分别是19，18,20,2〗，19,19。显而易见，最佳调度方案是1，3,2,其完成时 
间为18。 

2. 算法设计 

对于批处理作业调度问题，由于我们要从〃个作业的所有排列中找出有最小完成时间和 
的作业调度，所以批处理作业调度问题的解空间是一棵排列树。按照回溯法搜索排列树的算法 
框架，设开始时 X = U ，2, …， 71] 是所给的《个作业，则相应的排列树由 x [ l : ㈧ 的所 有排列 
构成。 

解批处理作业调度问题的回溯算法 Backtrack 是类 Flowshop 的私有成员函数。函数 Flow 
是 Howshop 的友员。 Flow 返回找到的最小完成时间和， bestx 返回相应的最佳作业调度。类 
Flowshop 的其他成员记录解空间中结点信息，以减少传给函数 Backtrack 的参数。二维数组 M 
是输人的作业处理时间。 beslf 记录当前最小完成时间和， bests 是相应的当前最佳作业 
调度。 

在递归函数 Backtrack 中，当 （ > n 时，表示算法已搜索至一个叶结点，得到一个新的作业 
调度方案。此时算法适时更新当前最优值和相应的当前最佳作业调度。 

当〖< «时，当前扩展结点位于排列树的第纟 - 1层。此时算法选择下一个要安排的作业， 
以深度优先的方式递归地对相应子树进行搜索。对于不满足上界约束的结点，则剪去相应的 
子树。 

解批处理作业调度问题的回溯算法可描述 如下： 


class Flowshop I 
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friend Flow( i»l * x $ int, inl I \ ): 

■ 
t 

// 各作业所需的处理时间 
//当前作业调度 
//«前最优作业调度 
// 机器 2 完成处理时间 
// 机器〖完成处理时间 
//完成时间和 
//当前最优值 
//作业数 


void Flowshop : : Back track (ifit i,) 

I 

if (i > n) i 

for (int j = 1 i j < = n; j + + ) 
bestx[j] = x[ j]; 
bestf - fj 
1 

else 

foT (int j = i ； j < = n;j+ + ) I 

fl M[x[j]][l ]； 

(2|.i] = ((f2[i - 1] > fl) ? f2[i - l] ： fl) + M[xLj]][2]; 

f + = 

if (f < bestf) I 
Swap(x[ij, x[j]); 

Back t rack (i + 1 )； 

Swap(x[i] ♦ x [ jJ ) ； 

fl - = \l[x[j]][lj; 
f — = (2[i]i 


int Flow (int* * M, int n y int beatxL]) 

I 

1 

int ub = 32767; 

Flowshop X; 

X.x =： n^w int [n + 1]; 

X.f2 = new int [ n + 1 ]; 

X-M ^ M; 


private: 

void Backtrark(int 
int * 兴 M ， 


* bestx ， 

* f 2， 

n , 

f, 

bestf ， 

n; 










X.n ^ n; 

X.bestx = bt«tx; 

X.Iwatf - tib; 

X.fl = 0; 

X.f = 0 ； 

for (int i = 0; i < = n; i + + ) 

X.f2[il = 0,X.x[i] =： i; 

X.Backtrack( 1); 
delete [ ] X. x; 

delete f ] X,O; 

return X . bestf ; 

雩 • • * r •• • ^ v* • • • r • r m ^ • §k^rSi>ii» • • •<•*、•••〆 • • • • • • • • • •• A. • • • • •• •• ••• ^ • • 

3. 算法效率 

由于算法 Backtrack 在每一个结点处耗费 0(1) 计算时间，故在最坏情况下，整个算法的计 
算时间复杂性为 0 U !)。 

5.4 符号三角形问题 

1 . 问题描述 

图 5 -4是由14个“ + ”号和14个“-”号组成的符号三角形。2个同号下面都是“ + ”号，2个 
异号下面都是号。 



+ 

图 5-4 符号三角形 

在一般情况 r ， 符号三角形的第一行有《个符号。符号三角形问题要求对于给定的^计 
算有多少个不同的符号三角形，使其所含的“ + ”和“1” 的个数相同。 

2. 算法设计 

对于符号三角形问题，我们用 n 元组 x [ l ^] 表示符号三角形的第一行的 n 个符号。当 
x [ i ] = 1时，表示符号二角形的第一行的第 i 个符号为％” 号; 当 x [ f ] = 0时,表示符号三角 
形的第一行的第/个符号为“ - ” 号; 1 <〖< n 。由于 x [ / ] 是二值的,所以在用回溯法解符号三 
角形问题时，可以用一棵完全二义树来表示其解空间。在符号三角形的第一行的前 i 个符号 


• 132 • 



x [ l : l '] 确定后，就确定了一个由 + 】）/2个符号组成的符号三角形。 F —步确定了 
x[i + 1] 的值后，只要在前面已确定的符号三角形的右边加一条边，就可以扩展为 x [ l ：^ + 1： 
所相应的符号三角形。最终由 X [1 : d 所确定的符号三角形中包含的％”兮个数 V -” 号个数 
同为 f U + 1)/4。因此在回溯搜索过程中可用当前符号三角形所包含的“ + ”号个数与 
号个数均不超过 n ^ + 1)/4 作为可行性约束，用于剪去不满足约朿的子树。对于给定的 n . 

当 n n + 1 )/2 为奇数时,显然不存在所包含的“ + ”号个数与“ _ ”号个数相 N 的符号三角形. 
这种情况可以通过简单的判断加以处理。 

在下面所给出的解符号三角形问题的回溯法描述中，递 W 函数 Backtrack ( l ) 实现对整个 
解空间的回溯搜索。 Badamck ( 0搜索解空间中第 Z 层子树。函数 Backtrack 娃类 Triangle 的成 
员。类 Triangle 的其他成员记录解空间中结点信息，以减少传给函数 Backtrack 的参数 isum 记 
录当前已找到的“+”号个数与号个数相同的符号=1角形数淄数 Compute 负贪类 Triangle 
的私有变量的初始化。 

在函数 Backtrack 中，当 f d 时，表示算法已搜索至一个叶结点，得到一个新的“ + ”号个 

数与号个数相同的符号三角形，因此当前已找到符号三角形数 sum 增】。 

当 n 时，当前扩展结点7是解空间中的一个内部结点。该结点有 x 〔〖] =1和 x [/] = 0 
共2个儿子结点。对当前扩展结点 Z 的每一个儿子结点，计算其相应的符号三角形中“ + ” 个 
数(^^^与“-”号个数，并以深度优先的方式递归地对可行子树进行搜索，或剪去不可行子树、、 

解符号三角形问题的回溯算法可描述 如下： 


class T riangle | 

friend int Compute(mt); 
private ： 

void Backtrack(int t )； 

intn, // 第一行的符号个数 

half, // n * (n + I )/4 

count, // 当前％”号个数 

* * P; // 符号二角形矩阵 

long sum; // 已找到的符号三角形数 

h 


void Triangle ； r Bark track (in I i) 

I 

if ({count > half) I I (t * (t 一 1 )/2 - count > half)) return ； 
if (t > n) sum + + ; 
else 

for (int i-0;i<2;i+ + )) 
p[l][t] = i; 
count + - i; 

for (int j = 2;j < =1 t;j + + ) J 
p[jj[i - j + 1] = plj - l][t ^ j + U'pfj - I ][t - j + 2]; 
count + 2 = pLj][t 一 j + 1 J; 
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Ba^ktraclc( t + 1); 
for (int j = 2;j < 
count - = pLj 」 [ 
count - = i; 


int Compute(i»t n) 

Triangle X; 

X 』 =n; 

X. count = 0 ； 

X.sum = 0; 

X. half = n * (n + 1 )/2; 
if (X.half%2 = = 1) return 0; 

X.half = X.hai£/2; 

int * ^ p =： new int * [ n + 1 ]; 
for (int i = 0; i < = n ； i + +) 

pLiJ - new ini [n + 1 」 ； 

foi (int i-0;i< = n;i+ + ) 

for (intj = 0; j < = n; j + + ) p[i][jj = 0; 

X.p - p ； 

X.B«cktrack( 1); 
return X.sum; 

[ 

______ J • • • • • • • ■讎馨 ■ 籲 _ t • ■ 壽籲 • /J / * • m • • • m 

3. 算法效率 

由于计算可行性约束需要 0 U ) 时间，在最坏情况下有 0(2〃） 个结点需要计算可行性约 
束，故解符号三角形问题的回溯算法 Backtrack 所需的计算时间为 0( n 2”。 

5.5 n 后问题 



1 . 问题描述 

«后问题要求在一个 ax a 格的棋盘上放置》个皇后，使得他们彼此不受攻击。按照国际 
象棋的规则，一个皇后可以攻击与之处在同一行或同一列或同一斜线上的其他任何棋子。因 
此, n 后问题等价于要求在一个 a x / I 格的棋盘上放置 n 个皇后，使得任何2个皇后不能被放 
在同一行或同一列或同一斜线上。 

2 . 算法设计 


对于 n 后问题，我们用 a 元组 x u 1 ： / i ] 表亦它的解。其中, x [ t ] 表 7 K 皇后〖放在棋盘的第 f 
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行的第 X [ / ] 列。 rti 丁 •不允许将任何2个皇后放在 N —列 h ， 所以解叫 .$ 中的诸 X: U 互不相 H u 
在这甲_，任何2个皂后不能放在同一斜线 hM 问题的隐约束。对于一般的。 G 问题，这•隐约 
朿条件可以化成 W. 约束的形式 JD 果将 n X a 格的棋盘看作是 * 个一.维力阵，其行 y 从 h 约 
下，列号从左到右依次编号为〗，2,…，《，那么，从 A: 上角到右下角的主对角线及其 T 行线（即 
斜率为 - 〗的各斜线）上，元素的2个卜标值的差(行号-列号）值相等:，同理，斜率为+ ] 的每 
•-条斜线上，兀素的2个下标值的和(行号+列号）值相等。闪此，若2个皇后放 置的位 賢分別 
是 U,y) 和 U，/)， 且 i -卜 k - lSLi 七卜 “ /,则说明这2个皇后处于 N- •斜线 I:，、以 _L 
2个方程分别等价于 i - k = j - imi - k = l - h 由此可知，只要 I / -左 I = I y- - H 成立， 
就表明这 2 个皇后位于同一条斜线 h。 于是，问题的隐约束化成了显约束。据此我们可以设计 
一 个函数 Place 来测试若将阜.后 A 放在 x[G 列是否与前向已放置的 A - 1个皇后都不在同- 
列，而旦都不在同一斜线上。 

用回溯法解 n 后问题时，可以用一棵完全 n 叉树来表示其解空问 3 用可行性约束函数 PW-e 
可剪去不满足行、列和斜线约束的子树。 

在下面所给出的解。后问题的回溯法描述中，递归函数 Backtrack ( l ) 实观对輳个解空问 
的回溯搜索。 Backtrack ( i ) 搜索解空间中第 i S 子树：_数 Backtrack 是类 Queen 的成 员：类 
Queen 的其他成员记录解空间中结点信息，以减少传给函数 Backtrack 的参数 jum 记录当前己 
找到的可行方案数。函数 nQiieeii 负责类 Queen 的私有变量的初始化。 

在函数 Backtick 屮，当 Z u 时，表示算法已搜索至一个叶结点，得到一个新的 n 皇后瓦 

不攻击放置方案，因此当前已找到的可行方案数 sum 增 U 

当71时，当前扩展结点 Z 是解空间中的一个内部结点。该结点有= l ，2，〜， n 共 
n 个儿子结点。对当前扩展结点2的每-个儿子结点，由函数 Place 检査其吋行性，并以深度优 
先的方式递归地对可行子树进行搜索，或剪去不可行子树。 

解 nfi 问题的回溯算法可描述 如下： 


class Qu^ri i 

friend int nQueen(int); 
private ： 

bool PlaceGnt k); 
void Baektrack(int l); 

int n, // 皇后 个数 

// 当前解 

long sum; // 当前已找到的可行方案数 



bool Queen :: Plai^C int k) 

I 

I 

for (int j = 1 ;j < k;j + +) 

if ((abs(k - j) = = abs(xLjj - x [ k ])) M (xjj = - x[kj))return false ; 


return true; 
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void Queen : : Bucklrack(inl U 

J 

I 

if (t > ri) sum + + ; 

else 

for (int i = l;i < = n;i + + ) j 
x[t] = ii 

if (Place(t)) Baektiack(t + 1); 


int nQueen(int n) 

I 

Queen X; 

// 初始化 x 

X.n = n; 

X-sum = 0; 

itit * p = new int [ n + 1 ]; 
for (int i = 0; i < = n; i 十 + ) 

p[i] - 0; 

X. x = p ； 

X. Backtrack (1); 
delete L ] p ； 
return X.sum; 


3 .迭代回溯 


由于数组 x 记录了解空间树中从根到当前扩展结点的路径，这些信息已包含了回溯法在 
回溯时所需要的信息。因此利用数组 X 所含的信息，可将上述回溯法表示成非递归的形式。这 
样一来，可省去0 U ) 的递归找空间。解 II 后问题的非递归迭代回溯法 Backtrack 可描述 如下: 

p I ^ • • • • ii % m w % ki 名參 _ _籲 _ _ • _ » • • • • • • 

class Queen i 

friend int nQueen(int ); 
private : 

bool PW^Cint k); 
void Backtrack(void); 

int n, // 皇后个数 

^x; // 当前解 

long sumi // 当前己找到的可行方案数 
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bool Queen ： : Pla<^e(int k) 

I 

4 

I 

for (int j = l ；j < k;j + + ) 

if ((abs(k - j) = = aWx[jj - x[k])) I ! (x[j] = = x[k])) return fal 咒 ; 
return true; 


void Queen :: Backtrack( void) 

I 

4 

I 

x[l] = 0; 
int k = 1 ； 
whilp (k > 0)] 
x[ kJ + = 1; 

while ((x[kj < = n) & & !(Place(k))) x[k] += 1; 
if (x[kj < = n) 

if (k = = n) sum + + ； 
else i 



x[ kj = 0; 

i 

I 

else k —; 


int nQueen(int ti) 

I 

I 

l 

Queen X; 

// 初始化 x 

X-n 二 n; 

X.sam - 0; 

int * p = new int [ ri + 1] i 
for (int i = 0;i< = n;i+ + ) 

p：ij = 0; 

X.x - p; 

X . Baektrack(); 
delete [] p ； 
return X.sum; 
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5.6 0-1 背包问题 


1. 算法描述 


0-1 背包问题也是一个子集选取问题。在一般情况下， 0-1 背包问题是 NP 难的。适合于用 
子集树表示 0 1背包问题的解空间。解 0- 1背包问题的回溯法与 5.2 节中讨论的解装载问题的 
回溯法十分相似。在搜索解空间树时，只要其左儿子结点 M —个可行结点，搜索就进入其左子 
树。在右子树中有可能包含最优解时才进人右子树搜索。否则将右子树剪去。这个任务由上界 
函数来完成。设/ ■ 足当前尚末考虑的剩余物品价值 总和； c P 是当前 价值; be Stp 是当前最优价 
值。则当 cp + r $ bestp 时，可剪去右子树。计算 A 子树中解的上界的一个史好的方法是将剩余 
物品依其单位重量价值排序，然后依次装入物品 f 直至装不下时，再装入该物品的一部分而装 
满背包。由此得到的价值是右子树中解的一个上界 1 

例如，对于 0-1 背包问题的一个实例 ， n = 4 ，c = 7，户= ；9,10,7,4 ],w = [3,5,2， lL 这 
4 个物品的单位重量价值分别为 [3,2,3.5,4]。 以物品单位重量价值的递减序装入物品。首先 
装人物品4,然后装入物品3和1。装人这3个物品后，剩余的背包容量为1，只能装入 0.2 的物 
品2。由此得到一个解为 : r = [1， CK 2,〖，1]， 其相应的价值为22。尽管这个解不是一个可行解， 
但可以证明其价值是最优值的一个 t 界。因此，对于这个实例，最优值不超过22。 

为了便于计算卜.界函数 ，町 先将物品依其单位重量价值从大到小排序，此后只要按顺序考 
察各物品即可 n 在实现时，由函数 Bound 来计算在当前结点处的上界 。 它是类 Knap 的私有成 
员。 Knap 的其他成员 E 录解空间树中的结点信总，以减少函数参数的传递以及递归调用时所 
需的栈空间。在解空间树的当前扩展结点处，仅当要进入右子树时才计算1：界函数以 
判断是否可以将右子树剪去。进人左子树时不需计算上界，因为其上界与其父结点的上界相 
同。 

在调用函数 Knapsack 之骱，需先将各物品依其单位重量价值从大到小排序。为此目的，我 
们定义了类 Object 。 其中，< =运算符与通常的定义相反，其0的是为了方便调用已有的排序 
算法。在通常情况下，排序算法将待排序元素从小到大排列。 

解 0-1 背包问题的回溯算法可描述 如下： 

鑛馨 * 籲馨馨 ■參雜 •_■■■« 壽 參 • • j • ^ • % 

template < class Typew, d ⑽ Typep > 
class Knap j 

friend Typep Knapsack(Typep * ， Typew w _ Typew ^ int); 
private ； 

Typep Baund(int i); 
void Backtrack(int i ); 

Typew // 背包容量 

int n; // 物品数 

Typew * w; // 物品重 fi 数组 

Typep* p ； // 物品价值数组 

Typew ow; // 当前重暈 

Typep cp; // 当前价值 
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I y pep 


// 巧前最 tt 价值 



template < class Typen , clus^ Typep > 
rypep Knap < Typew, Typep > :: Boun<J(int i) 

: // 计算 j : 界 

lypew deft - c - cw; // 剩余容量 

Typep b = cp ； 

// 以物品单位重量价值递减序装入物品 

while (i < = n & & w[i」 < = cleft) I 
cleft - - w[ij ; 

b + = p[i]; 



// 装满背包 

if (i < - n) b + = p[i]/w ： i] * cleft; 
return b; 


template < clsi&s Typew, class Typ^p > 

void Knap < Typew, Typep ：> : : Backtrack (int i) 

參 

if (i > n) < 

= cp j 
return; i 

if (cw + -w[i] < = e) \// x[ij = I 
uw + = w[i]; 
cp + = p[ij ； 

Backtrack (J + 1); 
cw - = w[i] \ 

叩 - =p'.i]; : 

if (Bound(i + 1) > hestp) // x[_i] = 0 
Backlraok(i + 1); 


class Object : 

friend int Knapsack(int ^ ， inf * ， int, int ); 
public : 

int operator < = (Object a) const 
I return (d > = a. tl);; 




int ID; 
float d; 


template < class Typew, class Typep > 

Typep Knapsack( Typep pU ， Typew w[] * Typew 

I ^ 

// 为 Knap： : Backtrack 初始化 
Typew W = 0; 

Typep P = 0; 

Object * Q = new Object in ]； 
for (int i - \\ i < = n; i + + ) 1 

Q[i - 1].ID = i ； 

QLi - 1] .d = 1 .0 * p[i]/w[i]; 

P + = p[i] i 

W + = w[i ]； 

I 

if (W < = c) return P; // 装人所有物品 
// 依物品单位重量价值排序 

Sort(Q f n) ; 

Knap < Typew，Typep > K; 

K.p = new Typep [n + l]; 

K• w = new Typew [n + 1 ]; 
for (int i = 1; i < = n; i + +) | 

K.p[i] = pLQ[i - 1] ， ID]; 

K.w[i] = w[ Q[i - 1 ]. JD ]； 

j 

K.cp = 0; 

K-cw = 0; 

K.c - o ； 

K, n = n; 

K.bestp = 0; 

// 回溯搜索 

K. Backtrack(1); 
delete LJ Q; 
delete [] K.w; 
delete [] K.p; 
return K. 




2 .算 法效率 


由于计算 h 界函数 Bound 需要 0( n ) 时间，在最坏情况下有 0(2°) 个右儿子结点 需费计 
算上界函数，故解 0- i 背包问题的回溯算法所甫的计算时间为 0( r ^),, 

5.7 最大团问题 


1. 问题描述 


给定一个无向图 （； = (v，£) 。如果 f/ g v， 且对任意 e 【/有 u,7;) e 匕则称 t/ 
是 C 的-个完全子图。 C 的完全子图 f/ 是 G 的一个团当且仅当 (/ 不包含在 c 的更大的完全子 
图中。 G 的最大团是指 G 中所含顶点数最多 的团。 

在图 5-5 中的无向图 C 中，子集 il ，2! 是 （； 的一个大小为2的完全 7- 图。这个完仝子图不 
是-个团，闪为它包含于 C 的更大的完全子图 U ，2, 51之中。：1,2,5(是 C 的一个最大团。 
!1,4,5> 和12,3,51也是 （； 的最大团。 



图 5 - 5 无向图 6 和（；的补图 6 

如果 C K 且对任意6 t / 有 U ， iO 备芯，则称 U 是 G 的一个空子阁。(；的空子 
图 U ： SG 的个独立集当且仅当 t / 不包含在 G 的更大的空+图中、/的最大独立集是 C 中所 
含顶点数最多的独立集。 _ 

对于任一无向图 （； = ( u ) 其补图忑= ( n , fi ) 定义为：= v , 且 u ， i ；) e 们当 
且仅当 U ， t ，） $ 

图 5^5( a ) 和图 5-5( b ) 中的两个无向图互为补图。 U ，4 l 是 C 的一个空子图， N 时也是 C 
的一个最大独立集。虽然11，2|是 7"; 的空子图，但它不是5的独立集，因为它包含在6的空子 
图|1，2,5;中。：1，2,5;是5的最大独立集。 

我们注意到，如果 t / 是的一个完全子图，则它是^的一个空子图，反之亦然。因此， C 的 
团与5的独立集之间存在 一一 对应关系。特别的， t / 是 G 的最 大团当 且仅当 L 是5的最大独 

立集 o 


2. 算法设计 

无向图 C 的最大团和最大独立集问题都可以用回溯法在 0 U 2” 时间内解决。图 C 的最 
大团和最大独立集问题都可以看作是图 C 的顶点集 K 的子集选取问题。因此可以用+集树表 
示问题的解空 M 。 解最大团问题的冋溯法与解装载问题的冋溯法十分相似。设当前扩展结点 Z 
位于解空间树的第丨层。在进人左子树前，必须确认从顶点丨到已选入的 K 点集中每一 1" 顶点 
都有边相迮。在进人右子树前，必须确认还有足够多的可选择顶点使得算法有"」能在右子树中 
找到更大的团。 
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在 M 体实现时，用邻接矩阵表 7 K 图函数 Backtrack 是类 Clique 的私有成员函数，而函数 
MaxCliqiK 1 负责冇关变暈的初始化以及阔用 Backtrack 进行搜索。 Backlm:k U 体实施对解空 
的回溯搜索 c 函数 MaxCUque 返回最大团的 大小; 整型数组 V 返回所找到的最大团。 v[i] = 1当 
且仅当顶点丨属于找到的最大团。 

解最 大团问 题的冋溯算法可描述 如下： 


clasA Clique i 

friend MaxClic[ue(inl 於 — ， int • ] ， int); 
pri vate : 

void Backtrack(int i); 

int x x a ， // 图 G 的邻接矩阵 

n, //fflG 的顶点数 

-^ x , // 当前解 

* bestx, // 当前最优解 

en ; // 当前顶点数 

bestn , //当前最大顶点数 

I ； 


void Cliqvje： : Bat,k track (int i) 

!// 计算最大团 


if (i > n) 


for (int j 

bestxLj ] 
bestn ^ c : 


- 1 ； j < " n; j + + 


Li 】; 


return ; f 

// 检査顶点〖与当前团的连接 

int OK = l; 

for (int j = 1; j < ii j + + ) 
if ( xlj ] & & a [ ij [ j ] = = 0) I 

" i 与 j 不相连 

OK - 0; 


break ; 


f ( OK ) 
x [ i ] 


xLi] 


Backtrack(i + 1) 
x[i] = 0; 


if (cn + ii - i > bcstn) I 
xlij = 0; 

Backtrack (i + 1);[ 
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int Max Clique (int •、 x a, int v . J , int n ) 


Clique Y; 

// 初始化 Y 

V.x = tiew int [_ n + 1J; 




Backtrack( l); 


delete i ] Y ♦ x; 
return Y,bestn; 


3. 算法效率 


解最大团问题的回溯算法 Backtrack 所需的计算时间显然为 0 ( n 2 n ) 


5.8 图的 m 着色问题 


1 . 问题描述 

给定一个无向连通图 c 和爪种不同的颜色。用这些颜色为图 c 的各顶点着色，每个顶点 
着一种颜色。试问是否有使得 G 中仟何一条边的2个顶点着有不 N 颜色的着色法。这个问题就 
是一个图的 m 可着色判定问题。若一个图最少需要 m 种颜色才能使图中任何一条边连接的 2 
个顶点着有不同颜色，则称这个数 m 为该图的色数。求一个阁的色数 m 的问题称为图的 m 可 
着色优化问题。 

如果一个图的所有顶点和边都能用某种方式圆在一个平面上 a 没有任何两边相交，则称 
这个图是可 平面图 。著名的平面图的四色猜想是图的 m 可着色性判定问题的一个特殊情形。 
这个猜想可表述为:在-个平面或球面上的任何地图能够只用4种颜色来着色，使得相邻的_ 
家在地图上着有不同颜色3这里假设每个国家在地图上必须是一个单连通域，还假设2个国家 
相邻是指这2个国家有一段长度不为0的公共边界，而不是只有一个公共点。任 f 可一个这样的 
地图很容易用一个平而图来表示。地图上的每一个区域相应于平面图屮一个顶点。若在地图上 
2个区域是相邻的,则它们在平面阁中相成的2个顶点之间有一条边相连。图 5-6 是一个 W 5 个 
区域的地图及其相成的平而 I 这个地图需要4种颜色来着色。 

很争 以的就 d 知道用5种颜色就足以为任何一个地图着色。另一方面又一直没找到一个 
需要4种以 t 颜色才能着色的地图，由此引出了四色猜想。这个猜想直到1 () 76年才由二个美 
国人依靠计算机的帮助做出了 证明: 仟何平而图都是可以 4 着色的 3 四色猜想从此变成了四色 
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图 54 地图及其相啶的平面图 

2. 算法设计 

在这一节屮，我们要讨论一般连通图的可着色性问题，而不仅限于平面图。我们感兴趣的 
足，给定了一个_ = U ， 幻和 m 种颜色，如罘这个 图小是 m 可着色的就给出否定 冋答; 如 
果这个图是 m 吋着色的，则要找出所有不同的着色法。要解决这个问题，除了用回溯法外 ， H 
前还没有什么更好的方法^ 

下面根据回溯法的递归描述框架 Backnack 来设计找一个阁的 m 着色法的算法。算法中用 
图的邻接矩阵 a 来表示一个无向连通图 G = (1/,幻。芯(~)属于图 G = (|/，£)的边集瓦， 
则 a [;][ y ] =丨，否则 a [〖][/] = 0。用整数1，2,…， m 来表示 m 种不同的颜色。顶点 i 所着的 
颜色用 x [ 〖]来表示。因此，该问题的解向量可以去示为〃元组 x[h n ]。 问题的解空间可表示 
为一棵高度为 n + 1的完全 m 叉树。解空间树的第 ^(1 层中每一结点都有 m 个儿 

子，每个儿子相应于 X [〖] 的 m 个可能的着色之一。第^ + 1层结点均为叶结点。图5 -7 是 
^ = 3和 m = 3时问题的解空间树。 

x[l]-l 

x[2]- 

x [3]- 

图 5-7 a = 3和 m = 3时的解空间树 

在下面所给出的解图的 m 可着色问题的回溯法描述屮，递! H 函数 Badarack ( l ) 实现对整 
个解空间的回溯搜索。 Backt 咖 k (() 搜索解空间中第€层子树:函数 Backtrack 是类 Color 的成 
员。类 Color 的其他成员 E 录解空间中结点信息，以减少传给函数 B 此 kt 哪 k 的参数。 sum 记录当 
前已找到的可 m 着色方案数。函数 mColoring 负责类 Color 的私有变量的初始化。 

在函数 Backtrack 中，当；> n 时，表示算法已搜索至••个1!|结点，得到一个新的 m 着色方 
案，因此当前已找到的可 m 着色方案数 sum 增1。 

当 ri 时，当前扩展结点 Z 是解空间中的一个内部结点。该结点有 x [ f ] = 1,2,，-,/«共 
m 个儿子结点。对当前扩展结点 Z 的每一个儿子结点，由函数 Ok 检査其町行性，并以深度优 
先的方式递归地对町行子树进行搜索,或剪去不可行子树。 

解图的 m 可着色问题的回溯算法町描述 如下： 



class Color | 
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friend int mCoJoriiig(^ ^ ); 
private ： 

bool Ok(int k); 
void Backtrack(int t); 


int 11 ， // 图的顶点数 

IM ， // 可用颜色数 

* //阌的邻接矩阵 


* x ， //当前解 

】ong sum ; //当前已找到的可 m 着色方案数 


bool Colur ： : Ok(int k) 

检査颜色可用性 

for (int j = 1 ;j < = ri;j + + ) 

if ((a[kj[j] = = i) & & (x[j] = = x[k])) return false; 
return true; 


void Color ： ： Backtraok(inl t) 

I 

A 

I 

if (t > n) I 
sum + + ; 

for (int i = l;i<zn;i+ + ) 
cout < < x 」」< < ' 、 

cout < < emll; 


else 

fur (int i = 1 ;i < = m;i + + ) | 
x[tj = i; 

if (0k(t) ) Backtrack(t + l); 


int m Coloring (int n y int in y hit ^ * a) 

§ 

Color X; 

// 初始化 x 

X.n - n; 

X.in = m; 

X. u = 

X.sum ^ 0; 








int * p = new itiL [n + 1 ]; 
for (int i = 0; i < - n; i + + ) 

p[i] - 0; 

X + x = p; 

X. Backtrack! 1); 
delete [j 
return X.sum; 


3. 算 法效率 

解图的 m 可着色问题的回溯算法的计算时间上界可以通过计算解空间树中内结点个数 

来估计。图的 m 可着色问题的解空间树中内结点个数是 f 对于每一个内结点，在最坏情 
况下，函数 Ok 检查当前扩展结点的每一个儿子所相应的 i 色的可用性需耗时因此， 

回溯算法总的时间耗费是^ mn ) ：= nm ( m n - 1)/( m - l ) - 0( nm 7l ) 0 

i = 0 

5.9 旅行售货员问题 


1. 算法描述 

旅行售货员问题的解空间是一棵排列树。对于排列树的回溯搜索与生成1，2,…，《的所有 
排列的递归算法 Perm 类似。设开始时 x = [1，2，一，^]，则相应的排列树由 x [ l ：^] 的所有排 
列构成。 

找旅行售货员回路的回溯算法 Backtrack 是类 Traveling 的私有成员函数， TSP 是 Traveling 
的友员。 TSP ( tO 返回旅行售货员回路最小费用。整型数组 c 返回相应的回路。如果所给的图 
G 不含旅行售货员回路，则返回 NoEdge 。 函数 TSP 所做的工作主要是为调用 Backtrack 所需的 
变量初始化。由 TSP 调用 Backtrack (2) 搜索整个解空间。 

在递归函数 Backtrack 中，当 f = a 时，当前扩展结点是排列树的叶结点的父结点。此时算 
法检测图 C 是否存在一条从顶点 x [« -〗]到顶点 x [ n ] 的边和一条从顶点 x [ 到顶点1的 
边。如果这两条边都存在，则找到一条旅行售货员回路。此时，算法还需判断这条回路的费用是 
否优于已找到的当前最优回路的费用 bestc 。 如果是，则必须更新当前最优值 fc eS tc 和当前最优 
解 bestXc 

当 i < n 时，当前扩展结点位于排列树的第〖 - 1层。图 （； 中存在从顶点 x [ j -]] 到顶点 
x [ /] 的边时 , x [ l ： t ] 构成图 C 的一条路径，且当 x [ l ： i ] 的费用小于当前最优值时算法进入排 
列树的第 i 层，否则将剪去相应的子树。算法中用变量 cc 记录当前路径 x [ ld ] 的费用。 

解旅行售货员问题的回溯算法可描述 如下： 


template < class Type > 
class Traveling \ 
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friend Type TSP(int * * ， int [ j ， ini ， Type) ; 
private : 

void Backlrack( int 1 ); 

int tl , // SG 的顶点数 

^ x , // 当前解 

^ bft > Lx ； // 当前最优解 
Tyf a . // 图 G 的邻接矩阵 
cc , // 当前费用 
bestc , // 当前最优值 
NoEdge ; //无边标记 


template < class Type > 

void Traveling < Type > t : Backtraek(int i) 

i 

if (i = = n) 1 

if ( aLx[n - 1]] W 【 i:] ! = NoEdge & & 
a [ x [‘ i ]][ l ] ! = NoEdge && 

(CC + a[x[n ■ l]] 〔 x[n]] + a[x[n]][l] < beatc I I 
bestc - - NoEdge)) \ 
for (int j = 1; j < : n; j + + ) 
bestx[j] = x[j ]； 

bestc = cc+ a[ x[ n - 1 ] ] [ x[n] ] + a[ x[ n] ] [ 1 ]; \ 

\ 

else I 

for (int j = i; j < = n; j + + ) 

// 是否可进人 X [ j ] 子树？ 

if (a[x[i- i]][x[j]] ! = NoEdge & & 

(oc + a[x[i - l]][x[i]J < bestc I I 
bestc = ^ NoEdge)) \ 

// 搜索子树 

Swap(x[i], x [ jj ) ; 

cc + = afxLi - 1 ] j[x[i]]; 

Backtrack(i +0; 

oc - = a[x[i - l 」 ][x[i]]; 

Swap(x[i] ， xLj]) i 1 


template < class Type > 

Type TSP(Type * * a，int v[ ] ， int n，Type NoEdge) 



Traveling < Type > \ ; 

// 初始化 Y 

Y.x = new int [n + 1 ]; 

// 胥 X 为单位排列 

for (ini i = 1 ； i < = i]; i 十十 ) 

Y.x[i] = i; 

Y.a = a ； 

Y.n ~ n; 

Y.besiv - NoEdge; 

Y.bestx v; 

Y.cc = 0; 

Y ， NoEd^e = NoEdgei 
// 搜索 x [2: n ] 的全排列 

Y_ Backtrack ⑵； 
delete [ ] Y.x; 
return Y. bestu; 


2. 算法效率 


如果不考虑更新 bestx 所需的计算时间，则 Backtrack 需要 0 ((n - 1)!) 计算时间。由于算 
法 Backtrack 在最坏情况下可能需要更新 0 ((n - 1)!) 次当前最优解 bmU , 每次更新 besU 需 
0( n ) 计算时间，从而整个算法的计算时间复杂性为0 U ! ) 。 

5.10 圆排列问题 

1 . 问题描述 

给定 n 个大小不等的圆4，…，^，现要将这汀个圆排进一个矩形框中，且要求各圆与 
矩形框的底边相切。圆排列问题要求从 r 个圆的所有排列中找出有最小长度的圆排列。例如， 
当 n = 3,且所给的3个圆的半径分别为 M ，2 时，这3个國的最小长度的圆排列如图54所 

示，其最小长度为2+ 4乃。 



图5,8最小长度圆排列 
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2. 算法设计 


由于我们要从 n 个岡的所有排列屮找出有最小长度的圆排列，听以圆排列问题的解空间 
是一棵排列树，按照 [ H ] 溯法搜索排列树的算法框架，设开始时 a = : r M r 2 ，…足所绐的“ 
个岡的半径，则相应的排列树由 a [ l :; i ] 的所有排列构成。 

解圆排列问题的回溯算法 Backtmrk 是类 Circle 的私有成员函数， ChrlePam 是 Circle 的友 
!/ UCirolePerm( n ， a ) 返回找到的最小圆排列长度。初始时数组 a 是输人的 u 个圆的半径， U 算 
结束后返回相说于最优解的岡排列函数 Centw 也是类 Circle 的私有成员函数,用于计算当前 
所选择的圆在 当前圆 排列屮圆心的横坐标。函数 CompiUe 是类 Circle 的另一个私有成员 函数， 
用于计算当前圆排列的氏度。类 C ir de 的私冇变量 miri 用于记录当前最小圆排列的 长度; 数组 r 
表示当前圆 排列; 数组 x 则记录当前圆排列中各_的岡心横坐标。算法中约定在当前圆排列中 
排在第一个的岡的圆心横坐标为0。 

在递归函数 Badamck 中，当 f n 时，表; S 算法已搜索至一个叶结点，得到一个新的圆排 

列方案。此时算法调用函数 CompiUe 计算 当前岡 排列的长度,时更新当前最优值。 

当 i < / I 时，当前扩展结点位予排列树的第； - 1层。此时算法选择下一个要排列的圆，并 
计算相应的下界函数。在满足下界约束的结点处，以深度优先的方 式递旳 地对相应子树迸行搜 
索。对于不满足下界约束的结点，则剪去相应的子树。 

解圆排列问题的回溯算法可描述 如下： 

• ti • j • j • • • ^ • • • • • • 1 • • # 

class Circle I 

friend float CirclePerm(int, float O ; 
private ： 

flout Center(int t); 
void Compute( void); 
void Back track (int t); 

flouL miti, // 当前最优值 

// 当前圆排列圆心横坐标 
… r; //当前圆排列 

int nj //待排列圆的个数 


float Circtc： : Ce«ler{int t) 

《//计算，前所选择圆的圆心横坐标 

float temp - 0; 

for (int j = l ;j < t；j + + ) i 

float valuex = x[j] + 2.0 sqrt(r[tj * r[j]); 
if (valuex > temp) temp = valuex; 

I 

I 

return temp; 
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void Circle: : Curnpute( void) 

I // 讣算当前圆排列的长度 

float low = 0, 
high = 0; 

for (int i = 1;i < ^ n;i + + ) i 

if(x「il - rri] < low) low = xLiJ - Hi」; 
if (x[i] + r[i] > high) high = x[i] + r:i]; 

參 

if (hi^fh - low < min) min = high ■ low; 


void Circle ： : Backtrack (int t) 

I 

I 

if (t > n) Compute(); 
else 

for (int j-t;j<=n;j+ + )i 
Swap(rf t] t rfjl); 
float centerx - Center(t); 
if (centerx + r[t * + r[ 1 ] < min) \// 卜界约束 
xLt 」 - centerx; 

Back t rack (t + 1); 

I 

I 

I 

Swap(rLtJ, rLjJ )； 


float CirclePermCint n r float ^ a) 

I 

4 

I 

Circle X; 

X,ri = n; 

X.r - a; 

X*jnin = 100000 ； 

float * x = new flual [ n + I ]； 
X.x = x; 

X. Backtracks 1); 
delete [ ] x; 
return X.min ； 
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3. 算法效率 


如果不考虑计算当前圆排列中各 [«i 的画心横坐标和计算当前 岡排 列长度所 耑的 计算吋 
间，则 Backtrack 崙要 OU!) il 算时间。巾于算法 Backtrack 在最坏情况卜吋能需要计算 
0 U ! ) 次当前岡排列长度,每次计算需0 U) 计算时间，从而整个算法的计算时间&杂性为 

0((n + 1 ) ! ) 0 

上述算法尚有许多改进的余地。例如，像1，2,…， n _ 1, ri 和^ n - 1,…，2,1这种瓦为镜 
像的排列具有相同的岡排列长度，只计算一个就够了^样一来，可 减少约 一半的计算簠。另一 
方面，如果所给的 n 个圆中有 A 个圆有相同的半径，则这个岡产生的 H 个完全相同的岡排 
列，只汁算一个就够了。上述算法的这些改进，留作练习。 

5,11 电路板排列问题 


1 . 问题描述 

电路板排列问题是大规模电子系统设汁中提出的一个实际问题。该问题的经典提法 是:将 
^块电路板以最佳排列方案插人带有〃个插槽的机箱中块电路板 的小问 的排列//式对 W 
于不同的电路板插人方案。 

设7? = U ，2, …， M 是 n 块电路板的集合。集合 JL = j / V lT ~ 2 ，…，丨是 n 块电路板的 
m 个连接块。其中每个连接块乂是 H 的一个子集，& 乂中的电路板用同一根导线连接在 

•一起。 

例如，设^= 5。给定；7块电路板及其 m 个连接块 如下： 

B : )1, 2,3,4,5,6,7,8|; L = ， 1 1 \'、， 

A r i = 14,5,61; A- 2 = i2,3i; A r 3 = il,3f; A r 4 = |3,6i; N 5 = 17,8k, 

这 8 块电路板的一个可能的排列如图 5-9 所示。 




阍 5-9 电路板排列 

设 x 表示4块电路板的一个排列，即在机箱的第 f 个插槽中插入电路板 x [ 丨 Ux 所确定的 
电路板排列密度 densilv ( x ) 定义为跨越相邻电路板插槽的最大连线数 

例如，图 5-9 中电路板排列的密度为2,跨越插槽2和3,插槽4和5以及插擠5和6的连 
线数均为2。插槽6和7之间尤跨越连线。其余相邻插槽之间都只有1条跨越连线、 

在设计机箱时，插槽一侧的布线间隙由电路板排列的密度所确定。因此电路板排列问题要 
求对于给定电路板连接条件(连接块），确定电路板的最佧排列,使其具有最小 密度、 
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2. 算法设计 


电路板排列问题是一个 np 难问题,因此不大可能找到解此问题的多项式时间算法 c r 面 
我们讨论用回溯法解电路板排列问题。通过系统地搜索问题解空间的排列树，找出电路板最佳 
排列。 

算法中用整型二维数组 B 表示输人。的值为1当且仅当电路板/在连接块％屮。设 
total [>] 是连 接块' 中的电路板数。对于电路板的部分排列 x [ l :(]， 设 now [；] 是中所包 
含的 / V ; 中的电路板数。由此可知，连 接块义 的连线跨越插槽/和丨+ 1当且仅当 mm [ y ] > 0且 
naw [>] # tota )[>]。 我们可以利用这个条件来计算插槽 i 和插槽；+ 1间的连线密度。 

我们用类 Board 来实现电路板排列问题的回溯算法。其私有成员函数 Backtrack 完成对解 
空间的搜索。函数 Arrangemenl 调用 Backtrack 计算并返电路板最佳排列的密度， bestx 返回 
电路板的最佳排列， 

函数 Arrangement 创建类 Board 的一个成 W X ，并初始化其相应的变 M 。 将 now [ l ：«] 初始 
化为 0 ; tolal [ y ] 初始化为连接块义中所含电路板数。函数调用 X . Baoktrack ( l ? 0) 搜索排列树 
寻求最佳排列。在一般情况下， X . Backtrack ^ cd ) 寻求最佳部分排列 x [ l ：^ 1]、其部分排列 
密度为 cd 。 

在算法 Backtrack 中，当 i u 时，所有 n 块电路板都已排定，其密度为 cd c 由于算法仅完 

成那些比当前最优解更好的排列，故 cd 肯定优于 beski 。 此时应更新 beside 

当< < 71时,电路板排列尚未完成是当前扩展结点所相应的部分排列， cd 是相 
应的部分排列密度。在当前部分排列之后加人一块未排定的电路板，扩展当前部分排列产生当 
前扩展结点的一个儿子结点。对于这个儿子结点，计算新的部分排列密度比仅当 W < bestd 
时，算法搜索相应的子树，否则该子树被剪去。 

按上述回溯搜索策略设计的解电路板排列问题的算法町描述 如下： 


class Board \ 

friend Arrangement(in{ * * , int ， inl，int L ]); 
private : 

void Backtrack(int i, im cd); 

int n, // 电路板数 

m, // 连接块数 
*x, // 1 前解 

^ bestx, // 当前最优解 
// 当前最优密度 

* total , // tatalLj]= 连接块 j 的电路板数 

* now , // »owLjJ = 当前解中所含 

// 连接块 j 的电路板数 

* ^ //连接块数组 


void Board: : Back track (int i T int cd) 
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!// 回溯搜索排列树 

if (i - - n) .* 

for (int j = 1; j < = n ； j + + ) 
bestxLj] = x[j]; 

besttl = c_i; 1 
else 

for (int j = i; j < = n; j + + ) j 

// 选择 x[jj 为下一块电路板 

int Id = 0; 

for (int k ^ 1; k < = m; k + +) \ 
now[k] + = B[x[j:]:k 」； 
if (now[k] > 0 & & tolal[k] ! - now[ k,) 

w + + ； 

I 

f 

// 更新 id 

if (cd > Id) Id = cdi 

if (Id < bestd) |// 搜索子树 

Swap(x[i], x[j]); 

Backtrack^i + 1 ， Id); 

Swap(xli], x[j]); \ 

// 恢复状态 

for (int k = l;k<=m;k+ + ) 
now[k] - - B[x[j]][k]; 


int Arrangement(int * * B, int n, int m，int beslx[]) 

I 

Board X; 

// 初始化 X 

X.x - new int [n + 1 ] ； 

X. tutal = new int [m + 1J; 

X.now - new int [m + l.. \ 

X.B =, B; 

X. n = n ； 

X.m - m; 

X-bestx = befttx; 

X.bestd = m + 1; 

// 初始化 total 和 now 

for (int i = 1; i < - m; i + + ) i 

X.totalLi] = 0; 

X.now[i] = 0; 
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// 初始化 X 为单 位排列 并计算 total 
for (ini i = 1; i < = n ； i + +) i 

= i ; 

for (int j= l;j< = m i j + + ) 

X.total[j] + = BLiJLjJ ； 

I 

¥ 

I 

// 回溯搜索 

X. Backtrack( 1 T 0); 
delete l J X.x; 

delete I 1 X- totali 

delete [_ J X. now; 

return X. l>estd; 


3. 算法效率 

在电路板排列问题解空间的排列树的每个结点处，函数 Backtrack 花费 0( m ) 计算时间为 
每个儿子结点计算密度因此计算密度所耗费的总计算时间为 0( 另外，牛成排列树需 
0 U !) 时间 3 更新当前 M 优解需 0[ mn ) 时间。这是因为每次史新当前最优解至少使 bestd 减 
少〗，而算法运行结束时 bestd ^ 0。因此最优解被更新的次数为 0( m ), 

综上可知，解电路板排列问题的冋溯算法 Backtrack 所需的计算时间为 0( 廳！）。 

5.12 连续邮资问题 

1. 问题描述 

假设某国家发行了 ri 种不同面值的邮票，并且规定每张伯封上最多只允许贴 m 张邮票。 
连续邮资问题要求对于给定的 u 和 m 的值，给出邮票面值的最佳设计，使得可在1张信封上贴 
出从邮资1开始，增量为1的最大连续邮资区间。例如，当 n = 5和 m = 4时，向值为（1，3,11， 
15,32) 的5种邮票可以贴出邮资的最大连续邮资区间 M 1到70。 

2. 算 法设计 

对于连续邮资问题，我们用〃元组 x [ l ： n ] 表氺 n , 种不同的邮票面值，并约定它们从小到 
大排列。 x [ l ] = 1是惟一的选择。此时的最人连续邮资区 问是 接下来 ， x [2] 的可取值 
范围是 [2: m + 1 ]。在一般情况下，已选定 x [ l ：.- l ] ，此时的最大连续邮资区间是[1 : r ] ,则接 
下来 x [ i ] 的吋取值范围是 [ x [〖-1]^ l : r + I ]。由此可以看出，在用回溯法解连续邮资问题 
时，可以用一棵树来表示其解空间。该解空间树中各结点的度随 x 的不同取值而变化。 

在下面的回溯法描述屮，递归函数 Backtrack 实现对整个解空间的回溯搜索。递归函数 
Backtrack 是类 Stamp 的成员。类 Stamp 的其他成员记录解空间屮结点信总，以减少传给函数 
Backtrack 的参数 c max value 记录当前已找到的最大选续邮资区间 ， bestx 是相应的当前最优解。 
数组 V 用于记录当前已选定的邮票面值 x [ l ： i ] 能贴出各种邮资所需的最少邮票张数。换句诂 

w 
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说， y [ A _ 足用+超过 m 张 lilf 位为 x [ 1 ： i j 的邮漠贴出邮资 / r 所沿的最少邮贺张数..、 

在函数 Backtrack 中，当 Z > ^时，表示算法已搜索至一个叶结点，得到一个新的邮票血位 
设计方案如果该方案能贴出的最大连续邮资区间大 丁1 前已找到的最大连续邮资 K 
间 max value ， 则更新当前最优 (li m . malue 和相应的最优解 be » U c 

^ «吋，当前扩展结点 Z 是解空间中的-个内部结点。在该结点处丨能贴出 
的最大连续邮资区 间为 r - U 因此,在结点 Z 处， x :〖] 的可取值范围坫 [ xj 〜 I ] + l : r ]， 从 
而，结点 Z 有； * - J / - 1] 个儿子结点。算法 对当 前扩展结点 Z 的每一个儿子结点，以深度优先 
的方式递归地对相成子树进行搜索。 

解连续邮资问题的回溯算法可描述如 F : 


class Slanifi i 

friend int MaxSlamp(i 【 U, inU int LJ); 
privale; 

void Backtrack(int i’inL r) i 

int n, // 邮栗面值数 

m, // 每张信封最多允许贴的邮票数 

max value, // 1 前 M 优值 
maxint, //大整数 

rnaxl ， // 邮资 h 界 

”， /7 3 前解 

*y ， //贴出各种邮资所需最少邮票数 

//当前最优解 


void Stamp： : Backtrack (int i,int r) 

I 

< 

I 

for (int j = 0; j < = x[i -2.*(m-l);j+ + ) 

if (yLjJ < m) 

for (int k = l;k < = my[j] ;k + + ) 

if (y jj + k < y[j + .xLi - 1 j * k]) y^j + x[i - l]" kj = y[jj + k; 

wliile ('[r] < maxint) r + + j 

一 

if (i > i 

if (r - l > max value) ! 
maxvalue ^ r - 1; 
for (int j = l;j<=n;j+ + ) 

bestx[jj ^ xLjJ ； 

ret urn; 

! 

I 

int * z - new int l_ maxi + 1 ^ ; 
for ( int k = 1; k < = myxl ； k + +) 
zLk. = y.k]; 

for (int j = x[I - i J + I ;j < = r;j + + ) i 
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xLi] = j; 

Back track (i + 1 ,r); 

for (、int k = 1; k < = : maxi;k + + ) 

y t k] = z[kl; i 

delete L 」 z; 


int MaxStamp(int n, int m，int bestx[」） 

I 

Stamp X; 

int maxint = 32767; 
int maxi = 1500； 

X.n - n; 

X.m = m; 

X. max value = 0； 

X.maxint = maxint; 

X.maxl = maxi; 

X.bestx = bestx; 

X.x = new int [n + 1J; 

X.y = new int L maxi + 1 ]; 

for (int i - 0; i < = n; i + 4-) X_x[i] = 0; 

for (int i = 1; i < = maxJ; i + + ) X.y[i] = rnaxint； 

X.x[l] = 1; 

X.y[0j ^ 0; 

X.Backtrack(2 > 1); 
delete [] X.x; 
delete L j X.y; 
return X* max value; 


5.13 回溯法的效率分析 

通过前面的具体实例的讨论容易看出，一个回溯算法的效率在很大程度上依赖于以下几 
个因素： 

(1) 产生 xU ] 的时间 ; 

(2) 满足显约束的 x [ fc ] 值的 个数； 

(3) 计算约束函数 Constraint 的时间； 

(4) 计算上界函数 Bound 的 时间； 

(5) 满足约束函数和上界函数约束的所有 x ： ft ] 的 个数。 

一 般地说 ，一 个好的约束函数能显箸地减少所生成的结点数。但这样的约束函数往往计算 
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M 较大。因此，在选择约束函数时通常存在着生成结点数与约朿函数计算 M 之问的折衷。我们 
希望总的计算时间较少，而+ M 考虑生成的结点数少或约束函数綷易计算。 

为了提高效率，通常可以应用所谓的“重排原理”。对于仵多问题而 N ， 在进行搜索试探时 
选取 X [ f :] 值的顺序是任意的:这就提示我们，在其他条件相当的前提下，让可取值最少的 
优先将更为有效。从图 5 H 0 所示的同一问题的两棵不同的解空间树，可以体会到这种策略的 
效力。 

在图5 -10 ( a ) 巾，若从第 i 层剪去 i 棵子树，则从所有应当考虑的3元 m 中… 次消去12个 
3元组:.对于图5 -10 ( h ) ， 虽然同样是从第1层剪去 I 棵子树，却只从尙当考虑的3 元组 中消去 
S 个3元组。前者的效果明显比后者好:. 



(b) 


图 5 • 10 同一问题的 2 棵不同的解空间树 

解空间的结构一经选定，影响间溯法效率的前5个因素就可以确定，只剩下生成结点的数 
H 是可变的，它将随问题的與体内容以及结点的不同生成方式而变动。即使是对同一问题的不 
同实例，回溯法所产生的结点数也会有很大变化。对于一个实例，回溯法可能只产生 0(/0 个 
结点。府对另一个非常相近的实例，回溯法可能就会产生解空间中所有结点。如果解空间的结 
点数是2〃 或《 !，则在最坏情况下，回溯法的吋间耗费一般为0 (p u 〉2” 或0 ( v u ) 〃 ！ ） 、，其 
中. pU ) 和 q ( n ) 均为/ ^的多项式。对〜个具体问题来说，回溯法的有效性往往就体现在当问 
题实例的规模 a 较大时，它能够用很少的时间就求出问题的解。而对于一个问题的具体实例， 
我们乂很难预测回溯法的算法行为。特别是我们很难佔计出回溯法在解这 …貝体 实例时所产 
生的结点数。这是我们在分析冋溯法效率时遇到的主要困难.下面我们介绍-•个概率方法，用 
于克服这一困难。 

当应用冋溯法解某一具体问题的具体实例/时，耵用蒙特卡罗方法来估算冋溯法将要产 
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生的结点数 门 . 该方法的主要思想是在解空间树上产牛-条随机的路径，然后沿此路径来佔算 
解空 M 树中满足约朿条件的结点总数 m 。 设: r 是所产生的随机路径上的一个结点，认位于解 
空间树的第 i 层上。吋 r %的所有儿+结点，用约束函数检测出满足约束条件的结点数 h 
路径上的下一个结点是从 X 的％ 个满足约束闲数的儿子结点中随机选取的 。这条 路衿一 直延 
伸到一个叶结点或荇一个所有儿子结点都不满足约朿条件的结点为止。通过这些的值，就 
可估算出解空 N 树中满足约束条件的结点总数 m .、 在用回溯法求问题的所杳解时，这个数特 
别4用。因为在这种情况下，解空间中所有满足约束条件的结点都必须生成。若只要求用回溯 
法找出 M 题的一个解，则所生成的结点数一般 m 个满足约束条件的结点中的一小部分。 
此时，用 W 来佔计回溯法生成的结点数就过于保守. 

为 r 从％的值求出 m 的值，还需要对约束阑数做一咚假定。在估计 m 时，假定所有约衆 
函数是静态的。也就是说，在 N 溯法执行过程屮，约朿函数并不随着算法所获得信息的多少而 
动态地改变。进一步还假设对解空间树中同一层的结点所用的约束函数是相同的。对于大多数 
的冋溯法，这种假定都太强了。实际 t ， 在大多数的回溯法中，约束函数是随着搜索过程的深人 
而逐渐加强的。在这种情形下，按照我们所做的假定来估计 W 就显得保守 2 如果将约束函数的 
变化也加以考虑,所得出的满足约束条件的结点总数就要比我们所估计的 m 少，而且也更 
精确. 

在静态约束函数的假设下.我们看到在第1层共有 me 个满足约束条件的结点。若解空间 
树的同一层结点具有相冋的出度，则第1层上每个结点平均冇个儿子结点满足约柬条件。 
因此，第2层有个满足约束条件的结点。同理，第3层卜，满足约朿条件的结点个数为 
爪。％ m 2 •.依此类推，町知第“1层上满足约束条件的结点个数为爪此，对于 

给定的输人/,如果随机地产 t 解空间树上的一条路径，并求出则可以 
估计出冋溯法要生成的满足约束条件的结点总数 m 为：】 + m Q+ mow ++ …。 

下面的算法以 Umate 依据上述思想来 计算回 溯法生成的结点总数该算法从解空间树 
的根结点开始选取一条随机路径。其中函数调用 Size ( T ) 得到的是集合7的 大小; Cho 0 S e ( 70 
则是从集合 r 中随机地选取一个元素。 

籲鉍 _■馨_馨讎 瓤馨 馨觚 馨 馨馨、 

int Estimate(int ni Type * x) 


while (k < = n) i 

SetType T . x[k] 的满足 约朿的 4 取值集合 ; 
if (Si^e( T) = = 0) return m; 
r * = Sisc^( T )； 
m + = r; 

x[k」= Choose( T); 

k + + ； ■! 

return m; 


当用回溯法求解某一具体问题时，可用算法 Estimate 估算回溯法生成的结点数。若要估计 
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得史精确些， 4 选取若十条不同的随机路径(通常不超过 20 条），分别刈各随机路径佔 H 结点 
总数，然后 冉取这 些结点总数的平均值，得到 m 的估算值 

例如，对于8后问题 ，要在 8 X 8的棋盘中放进8个阜后，其放法的组合数是很 大的。 利用显 
约柬排除那些有2个氧后在同-行或吋一列的放法,也还有8!种不同的放法。我们可以用算法 
Estimate 来估计解 n G 问题的 [ Hi 溯法 nOiieen 所产生的结点总数。容易看出，別于该问题，约束 
函数的静态假设足成0:的，即在算法的搜索过程中，约束函数并没有改变。 W 外，在解空间树 
中，同一层的所有结点都有相同的出度。图5 - 11给出了算法 Estimate 产生的5条随机路径所相 
成的8 x 8棋盘状态。当需要在棋盘卜_某行放人一个皇后时，所放的列是随机地选取的。它与已 
在棋盘上的其他后互4、攻击， 

在阁中祺盘下面列出了每一层的结点可能生成的满足约束条件的结点数，即 
m 2 , …叫，…， 以及由此随机路校估算出的结点总数 m 的值。由这5条随机路抒可以得到 m 的 
平均值为〗702 ( 而8后问题的解空间树的结点总数是 

1 + S ( lt ( 8 一 )） = 109 601 

^ = 0 i = 0 



( 8 , 5 , 4 ^^)= 1649 ( 6^,1 ^, 1)=769 ( 8 , 6 , 4 ^, 1 , 1 , 1)=1785 



(R ， 6,0 W77 ， 1>2329 

图 5 -n 解空间树中 5 条随机路径所对应的棋盘状态 

因此，冋溯法产生的结点数 m 是解空间树的结点总数的1.55%左右。这说明冋溯法的效 
率大大高于穷举法、 

习题5 

5-1 用教材中提到的改进策略1重写装载问题的四溯法，使改进后算法的计算时间复杂 
性为0(2”。 

5-2 用教材屮提到的改进策略2重写装载问题的回溯法，使改进后算达的计算时间复杂 
性为 0 ( 2 n h 

5-3 试设计一个解子集和问题的递归回溯法。注意对于子集和问题，一曰.找到和为 c 的 
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子集，算法即町终止。算法屮+必记录当的婊优解，也+必用数 组 X 当 前路怜 J "! 题的解可 

在找到和为 c 的了集 G 币:新构造。 

5、4审写 0- 丨背包问题的回溯法，使算法运行结朿后能输出最优解。 

5-5 试设计--个解最人团问题的迭代凹溯法 
5、6试设计〜个解最大独立集问题的回溯法。 

5‘1 设 （； £ 一个有 n 个顷点的有向阁，从顷点 i 发出的边的最大费用记为 max(/)o 

(1) 证明任何一个旅行告货员回路的费用都+超过+ 1。 

[ =I 

(2) 在解旅行售货员间题的回溯法巾，用 L 向的界作为 l ) estc 的初始值，重 y 该算法，并尽 
可能地简化代码。 

5^8 设 G 足一个有 n 个顶点的有向围 3 从顷点/发出的边的最小费用记为 min(Oc 

(0 证明图 r ; 的所有前缀为 yiw ] 的旅行售货员 N 路的费用至少为，巧）+ 

/ = 2 

g m in ( \ ) ， 其屮 ， a ( a ， u ) 足边 （ u , v ) 的费用 c . 

(2) 利用上述结论设汁一个高效的 h 界函数，重写旅行售货 ft 问题的回溯法，并与教材中 
的算法迸行比较. 

5^9最小长度电路板排列问题。在电路板排列问题屮，连接块的度是指该连接块中第 
1块电路板到最后1块电路板之间的距离。例如，在图 5-9 所示的电路板排列中，连接块的 
第1块电路板在插槽3 1、它的最后 I 块电路板在插槽6中，因此的长度为3。冋理 iV 2 的长 

度为2。图 5-9 屮连接块最大长度为3。试设计一个回溯法找出所给《个电路板的最佳排列，使 
得 m 个连接块中最大长度达到最小。 

5-10 最小電量机器设计问题。设某一机器由《个部件组成，每一种部件都 可以从 m 个 
不同的供应商处购得。设％,足从供应商 j 处购得的部件；的重量，％是相❿的价格。试设计一 
个算法，给出总价格不超过 c 的最小重童机器设计。 

5-11 试设计一个用凹溯法搜索子集空问树的函数。该函数的参数包括结点可行件判定 
函数和上界函数等必要的函数，并将此函数用 f 解装载问题和 CM 背包问题。 

5-12 用排列空 M 树做习题541。 

5-13 试设计-个用回溯法搜索一般解空间的函数。该函数的参数包括:生成解空间中 
下一扩展结点的函数、结点叮行性判定函数和上界函数等必要的函数，并将此函数用于解装载 
问题和 0-1 背包问题。 

5-14 运动员最佳配对问题。 ‘ 个羽毛球队冇男女运动员各 n 人，给定2个 ax ^矩阵尸 
和6。口[/][/]是男运动员〖和女运动员 y 配对组成混合双打时的竞赛优势; Q [ i ][ y ] 则是女运 
动员 i 和男运动员 y 配合时的竞赛优势。显然，由于技术的配合和心理状态等各种因素的影响， 
p [ i ][ j ] 不一定等于设计一个算法，计算出男女运动员的最佳配对法，使各组男女 
双方竞赛优势乘积的总和达到最大。 

5-15 无分隔符字 典问题 。设乂 = …，％丨是 n 个互不相同的符 g - 组成的符兮 

集山= … a 丨 a e E，u ^ w 中宇符组成的长度 为&的 宁符串全体。 se 心 
是4的一个无分隔符字 典足指 对任意〜心…以£ S 和 e t s , 则 
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\a 2 a ： y , --a k b^<i^ayb\h2y' , ^a k h ] b2 mt ^>k.\' H ^ =2 

尤分 隔符字典问题要求对给定的 a ， D 以及正整数I编程计算心的最大无分隔符 

m _ 

5-16 无和集问题。设 S 是-个正整数集合。 S 是一个无和集当 H . 仅与 m € S 蕴含 : t 
+ 7$ S 。 对于仟意正整数 / c ， 如宋可将 II ,2,…， k 划分为》个无和子集\乃 2 ,…，\，则称 
正整数4是《可分的 : 记 F(n) = maxi k I k 是 n ⑷分的 1 。 试设计一个算法，对任意给定的 
计算 ») 的值。 

5-17 四色方柱问题 （instam Insanity)。 设有4个立方体，每个立 J/ 体的拇-“面用红、庹、 
蓝、绿4种颜色之-染成。我们发把这4个立方体叠成一个方形柱体，使得柱体的4个侧面的每 
一侧均有4种不同的颜色。同时 .4 个顶面和4个底面也都有4种不同的颜乜，试设汁 ▲个 回溯 
算法，计算出4个立//体的-•种满足要求的叠置方案。 

5-18 整数变换问题。关于整数/的变换/和#定义 如下: /(i〉 = 3i;g(i) 试 

设计一个算法，对于给定的两个整数《和 m ，用最少的/和 g 变换次数将 n 变换为例如，我 
们可以将整数15用4次变换将它变换为整数4: 4= 当整数 n 不可能变换为整数爪 

时，算法应如何处理？ 

5-19 排列宝石问题。设有 n 种不同的颜色，同-•种形状的《颗宝石分别具有这 n 种不 
同的颜色:，现有^种不同形状的宝厶共一颗，欲将这^颗宝石排列成 a 行 a 列的一个方阵, 
使方阵中每一行和每一列的宝石都有 n 种不同形状和《种不同颜色。试设计 • • f 算法计算出 
对于给定的 a 有多少种不同的宝石排列方案。 

5-20 网络设计问题。石油传输网络通常可表示为一个非循环带权有向图 G.G 中冇… 
个称为源的顶点6。石油从该顶点输送至 C 中其他顶点。图 C 中每条边的权丧示该边连接的两 
个顶点间的距离。网络中的油压随距离增大而减小。为了保证整个输油网络止常工作，耑要维 
持网络中的最低油压 P [ni „ 。为此需要在网络的某些或全部顶点处设置增压器。在设置增 Hi 器的 
顶点处油压可升至最大值 P _ ^油压从/ \ iax 减至可使石油传输的距离至少为夂试设计 
一 个算法，计算出网络中增压器的最优放置方案,使得用最少的增压器保证石油运输 畅通。 

5-21 罗密欧与朱丽叶的迷宫。罗密欧与朱丽叶身处一个 
m 乂 n 的迷容 中，如图 5-12 所示。每一个方格表示迷宮巾的一个 
房间。这 m x ^个房间巾冇一些房间是封闭的，不允许任何人进 
人。在迷宫中任何位置均可沿8个方叫进人未封闭的房间。罗密欧 
ft 于迷宫的(/>， g) 方格中，他必须找出一条通向朱丽叶所在的 
(r,，0 方格的路,在抵达朱丽叶力格之前，他必须走遍所有未封闭 
的房间各一次，㈨且要使到达朱丽叶方格的转弯次数为最少。每 
改变一次前进方昀算作转弯一次。请设计一个算法帮助罗密欧找 
出这样 - 条道路。 

5-22 工作分配问题。设有 n 件工作要分配给 n 个人去完成,将丁.作〖分配给第^个人所 
需的费用为 c V W： 设计一个算法，为每一个人都分配1件不同的工作，并使总费用达到最小。 

5-23 独立钻石跳棋 问题 。图 5- U 所示的33个方格顶点摆放着32枚棋子，仅中央的顶点 
空着末摆放棋子。下棋的规则娃任一棋子可以沿水平或垂直方向跳过4其相邻的棋子进人空 
着的顶点并吃掉被跳过的棋子。试设计一个算法，找出一种下棋方法，使得最终棋盘上只剩下 
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一 个棋了在棋盘屮央 

5-24 智力拼图问题。设冇12个平向图形如图 5 M 4 所示。每个图形的形状互不相同，但 
它们都足由5个大小相同的正方形所组成。在[冬1 5 - 14中，这12个图形拼接成-个6 x 10的矩 
形:>试设汁…个算法，计算出有多少 种不同 的方案 可用这 U 个图形拼接成一个6 x 10的矩形。 


图 5-13 独立钻心跳棋初始布局 阁5-14智力拼图 

5-25 布线问题。假段我们要将一组元件安装在一块线路板上，为 此需要 设计一个线路 
板布线方案。各元件的连线数由连线矩阵 coim 给出，儿件 t 和元件 j 之间的连线数为 ccmnG, 
y )。如果将元件/安装在线路板上位置 r 处， fW 将元件 y 安装在线路板上位置 s 处，则元件/和 
元件/之间的距离为 dist(r 确定了所给的〃个元件的安装位置，就确定了一个布线方案。 
与此布线方案相应的布线成本为 2] 00111 1 (;，乃*0^1(/*4)3试设计一个算法找出所给”个 

元件的布线成本最小的布线方案: 

5-26 最佳调度问题。假设有 n 个任务要由个可并行丄作的机器来完成。完成任务〖需 
要的时间为试设计一个算法找出完成这《个任务的最佳调度，使得完成全部任务的时间最 
早 。 

5-27 无优先级运算问题。设有 a,6，c，d，e 5个整数和运箅符 + , - , _>:，/，且运算符无 
优先级。如2 + 3^5 . 25。对于给定的整数《 ,试设计一个算法，用以. t 给出的5个数和运算 
符，产生整数且用的运算次数最少。 

5-28 最大 k 乘积问题。设/适一个 ^ 位十进制整数。如果将 / 划分为 A 段，则可 得到& 
个整数。这个整数的乘积称为/的一个 &乘积 。试设计一个算法，对于给定的/和I 求出/的 
最大& 乘积。 

5^29 世界名阔陈列馆问题。世界名 W 陈列馆由 m x a 个陈列室组成。为了防止名画被 
盗，需要在陈列室中设置警卫机器人哨位。每个警卫机器人除 f 监视它所在的陈列室外，还可 
以监视与它所在的陈列室相邻的上、下、左、右4个陈列室。试设计-个安排警卫机器人哨位的 
算法，使得名画陈列馆中每一个陈列室都在警 n 机器人的监视之下，且所用的警卫机器人数 
最少 C 

5-30 世界名画陈列馆问题。在上题中，如果要求每-个陈列室仅受-个警卫机器人监 
视，则应如何设置警机器人的哨位。 

5-31 魔方 （ Hubik’bCiibe) 问题。给定魔方的初始状态和目标状态，试设 H •—个算法计算 
出从初始状态到目标状态所葙的最少旋转次数。当初始状态不可能变换为 H 标状态时，算法是 
否会陷人死循环？ 
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第 6 章分支限界法 


学习要点 

• ■ W - 

‘ 理解分支限界法的剪枝搜索策略 

• 掌握分支限界法的算法 框架： 

( 1 ) 队列式 （ FIFO ) 分支限界法 

(2) 优先队列式分支限界法 

• 通过下面的应用范例学习分支限界法的设计 策略： 

(1) 单源最短路径问题 

(2) 装栽问题 

(3) 布线问题 

(4) 0- 1背包问题 

(5) 最大团问题 

(6) 旅行售货员问题 

(7) 电路板排列问题 

(8) 批处理作业调度问题 

分支限界法类似于回溯法，也是一种在问题的解空问树 r 上搜索问题解的算法。但在一 
般情况下，分支限界法与回溯法的求解 H 标不同。回溯法的求解目标是找出 r 中满足约束条 
件的所有解，而分支限界法的求解目标则是找出满足约束条件的-•个解 4 或是在满足约束条件 
的解中找出使某一 目标函 数值达到极大或极小的解，即在某种意义 下的最 优解. 

由于求解 H 标不同，导致分支限界法与回溯法在解空间树 r 上的搜索方式也+相同。回 
溯法以深度优先的方式搜索解空间树 r ， 而分支限界法则以广度优先或以最小耗费优先的方 
式搜索解空间树 r 。 分支限界法的搜索策略是，在扩展结点处，先生成其所有的儿子结点(分 
支），然 G 再从为前的活结点衣中选择下一个扩展结点 2 为了冇效地选择下一扩展结点，以加速 
搜索的进程，在每一活结点处，计算一个函数值(限界），并根据这些已计算出的函数值，从当时 
活结点表中选择一个最有利的结点作为扩展结点，使搜索朝着解宁间树上有最优解的分支推 
进，以便尽快地找出一个最优解。这种方法就称为分支限界法。人们已经用分支限界法解决 r 
大量离散最优化的实际问题。 

6.1 分支限界法的基本思想 

分支限界法常以广度优先或以最小耗费(最大效益）优先的力式搜索问题的解空间树 j 可 
题的解空间树是哀示问题解空间的一棵有序树，常见的有子集树和排列树。在搜索问题的解空 
间树时，分支限 界法与 iHl 溯法对当前扩展结点所采用的扩展方式不 问:在 分支限界法中，每一 
个活结点只有一次机会成为扩展结点。活结点一曰.成为扩展结点，就一次件产生其所有儿子结 
点。在这些儿子结点中，那些导致不4行解或导致非最优解的儿子结点被舍弃,其余儿子结点 
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被加人活结点表中。此从活结点表屮取下•结点成为当前扩展结点，并 i: 复上述结点扩展 
过程。这个过桿一自:持续到找到所需的解或活结点表为空时为止、、 

从活结点表中选择下一扩展结点的小问方式导致不同的分支限界法。最常见的冇以下两 
种方式： 

(0 队列式 (FIFO) 分支限界法 

队列式分支限界法将活结点去组织成一个队列，并按队列的尤进先出原则选取下一个结 
点为当前扩展结点。 

(2) 优沱队列式分支限界法 

优先队列式的分支限界法将活结点表组织成一个优队列，并按优先队列中规定的结点 
优先级选取优先级最高的下一个结点成为当前扩展结点。 

优先队列屮规定的结点优先级常用一个与该结点相关的数值 P 来表示。结点优先级的卨 
低与/>值的大小相关。最大优先队列规定^值较大的结点优先级较高。在算法实现时通常用一 
个最大堆来实现最大优先队列，用最大堆的1^1(^11^运算抽取堆中下一个结点成为当前扩 
展结点，体现最大效益优先的原则。类似地，最小优先队列规定值较小的结点优先级较高。在 
算法实现时通常用一个最小堆来实现最小优先队列，用最小堆的运算抽取堆屮下一 
个结点成为当前扩展结点，体现最小费用优宄的原则。 

用优先队列式分支限界法解具体问题吋，应根据具体问题的特点确定选用最大优先队列 
或最小优先队列来表示解空间的活结点表。 

例如，考虑 n = 3时 0-1 背包问题的一个实例如下 n [16, 15, 15], P = [45,25,25], 
c = 30o 这个例了-我们在笫5章中曾经讨论过，其解空间是图 5-1 中的子集树。 

用队列式分支限界法解此问题时，用一个队列来存储活结点表。算法从根结点4幵始。初 
始时活结点队列为空，结点4是当前扩展结点。结点4的2个儿子结点4和 B 均为叫行结点， 
故将这2个儿子结点按从左到右的顺序加人活结点队列，并且舍弃当前扩展结点4。依先进先 
出原则， T 一个扩展结点是活结点队列的队旨结点扩展结点得到其儿子结点和瓦。由 
于/>是不可行结点，故被舍是可行结点，被加人活结点队列。接下来， C 成为当前扩展结 
点，它的2个儿子结点 F 和 C 均为吋行结点，因此被加入到活结点队列中。扩展下一个结点尺 
得到结点 J 和火」是不可行结点，因时被舍去。久是一个4行的叶结点，表示所求问题的一个 
可行解，其价值为45。 

当前活结点队列的队首结点 F 成为下一个扩展结点。它的2个儿子结点 L 和 M 均为叶结 
点。 L 表示获得价值为50的可 行解； M 表示获得价值为25的可行解。 C 是最后的一个扩展结 
点，其儿子结点/V和0均为可行叶结点。最后，活结点队列已空，算法终止:算法搜索得到最优 
值为50。 

从这个例子容易看出，队列式分支限界法搜索解空间树的方式与解空间树的广度优先遍 
历算法极为相似。惟一的不冋之处是队列式分支限界法不搜索以不可行结点为根的子树。 

优先队列式分支限界法也是从根结点4开始搜索解空间树的。我们用一个极大堆来表示 
活结点表的优先队列，该优先队列的优先级定义为活结点所获得的价值。初始时堆为空，扩展 
结点4得到它的2个儿子结 点及和 C。 这2个结点均为可行结点，因此被加入到堆中，结点4 
被舍弃 。结点 5获得的当前价值是40,而结点 C 的当前价值为 0c 由于结点 S 的价值大于结点 
C 的价值，所以结点6是堆中最大元素，从而成为下一个扩展结点。扩展结点 B 得到结点0和 
K。/) 不是可行结点，因而被舍去 。冗 足可行结点被加人到堆中。 E 的价值为40,成为当前堆中 
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最大元素，从而成为下•个扩展结点，扩展结点£得到2个叶结点 y 和 u 是不呵行结点被舍 
n,K 足一个可行叶结点，表不所求 问题的 一个町行解，艿价值为 45 :此时，堆屮 a 剩 F —个活 
结点 C ， 它成为当前扩展结点。它的2个儿子结点/'和 C 均为可行结点，因此被插入到当前堆 
中。结点 F 的价值为25,是堆中最人元素，成为下一个扩展 结点# 点 F 的2个儿子结点人和 
M 均为叶结点叶结点 Z ： 相应于价值为50的讨行解。叶结点相应于价值为25的 可行解 。叶 
结点 /. 所相应的解成为当前最优解。最后，结点 6' 成为扩展结点，其儿子结点 Y 和均为叶结 
点，它们的价值分别为25和0。接下来，存储活结点的堆 Li 空，算法终止。算法搜索得到最优值 
为50、相应的最优解是从根结点4到结点 L 的路径(0,1， 1)., 

当我们要寻求 M 题的一个最优解时，4我们在讨论间溯法时类似地 y 以用剪枝函数来加 
速搜索。该函数给出每一个可行结点相应的子树可能获得的最大价值的 I ：界。如果这个上界不 
会比当前最优值更大，则说明相应的子树中不含问题的最优解，闪而以剪去，另-方面，我们 
也可以将上界函数确定的毎个结点的匕界值作为优先级，以该优先级的非增序抽取当前扩展 
结点。这种策略冇时可以更迅速地找到最优解 

我们再来看一个4城市旅行售货 W 的例子，如图 5-3 所；该问题的解空间树是-棵排列 
树。解此问题的队列式分支限界法以排列树中结点 B 作为初始扩畏结点。此时，活结点队列为 
空。由于从图 C 的顶点1到顶点2 . 3和4均仓边相连，所以结点 B 的儿子结点 C , U ， E 均为可 
行结点，它们被加入到活结点队列中，并舍占当前扩展结点心当前活结点队列中的队首结点 
C 成为下一个扩展结点。由于图 C 的顶点2到顶点3和4有边相连，敁结点 C 的2个儿了结点 
F 和 (； 均为叮彳7结点，从而被加人到活结点队列中。接下来，结点 " 和结点 K 相继成为扩展结 
点而被扩展。此吋，活结点队列中的结点依次为 F ， G , H ，[ J . K , 

结点 F 成为下一个扩展结点，其儿子结点 A 是一个叶结点。我们找到了一条旅行售货员 
回路，其费用为59。从下一个扩展结点 C 得到叶结点对，它相应的旅行售黃员 W 路的费用为 
66。结点//依次成为扩展结点，得到结点~相应的旅行售货员冋路，其费用为25。这是当前最 
好的一条回路.下一个扩展结点是结点/，由于从根结点到叶结点/的费用26匕超过了当前最 
优值，故没有必要扩展结点/,以结点/为根的子树被剪去，最后，结点 * /和 A 被依次扩展，活结 
点队列成为空，算法终止。算法搜索得到最优值为25,相应的最优解足从根结戍到结点的路 
径(1，3_2,4，1)。 

解同一问题的优先队列式分支限界法用一极小堆来存储活结点衣。 其沈先 级是结点的当 
前费用。算法还足从排列树的结点 S 和空优先队列开始。结点5被扩展后，它的3个儿子结点 
C ， 和£被依次插入堆中.此吋，由于 A 是堆中 _ ji •有最小当前费用 (4) 的结点，所以处于堆顶 
的位置，它0然成为卩一个扩展结点。结点 f 被扩展0，其儿？结点^/和 A 被插人当盼堆中，它 
们的费用分别为14和24。此时，堆顶元素是结点良它成为下一个扩展结点.,它的2个儿？结 
点 H 和 I 被插入堆中。此吋堆中含冇结点 C , HJJ f K c 在这些结点中，结点 W 具有最小费用， 
从而它成为下一个扩展结点。扩展结点//后得到一条旅行售货路 （1 ，3,2,4，1)，相应的费 
用为25。接下来，结点/成为扩展结点，由此得到另一条费用为25的 | H ] 路 ( 1,4,2.3,1 )。此后的 
2 个扩展结点是结点和/。由结点尺得到的可行解费用高于3前最优解，结点/本身的费用 
已高于当前最优解，从而它们都不能得到更好的解。最后，优先队列为空，算法终止 

与 0-1 背包问题的例子类似/可以用一个限界函数在搜索过程屮裁剪 了树， 以减少产土的 
活结点。此时剪枝函数是当前结点扩展后得到的最小费用的一个 F 界。如杲在巧前扩展结点 
处，这个下界不比当前最优值更小，则以该结点为根的子树可以被剪去。另一方 M , 我们也可以 


• 165 • 



把每个结点的下界作为优先级，依非减序从活结点优先队列中柚取 卜一个 扩展结点、, 


6.2 单源最短路径问题 

单源最短路径问题适合于用分支限界法求解。我们先来看单源最短路径问题的一个实例。 
在图 6-1 所给的有向图 G 中，每-边都有-♦个非负边权。我们要求图 C 的从源顶点 s 到目标顶 
点 t 之间的最短 路径: 解单源最短路径问题的优先队列式分支限界法用-极小堆来存储活结 
点表。其优先级是结点所对成的当前路长。算法从图 C 的源顶点和空优先队列开始。结点 .s 被 
扩展后，它的 3 个儿子结点被依次插人堆中。此后，算法从堆中取出具有最小当前路长的结点 
作为当前扩展结点，并依次检查号当前扩展结点相邻的所有顶点。如果从当前扩展结点纟到顶 
点 y 有边可达， a 从源出发，途经 顶点纟 再到顶点 ） 的所相应的路径的长度小于当前最优路径长 
度，则将该顶点作为活结点插人到活结点优先 队列中 。这个 结点的扩展过程一直继续到活结点 
优先队列为空时为止。 



图 6-1 有向图 C 

图6 -2 是用优先队列式分支限界法解图 6，1 所给的有向图 的单源最短路径问题所产生 
的解空间树。其中，每一个结点旁边的 数字表 示该结点所对应的当前路长。由于图 C 中各边的 
权均非负，所以结点所对应的当前路长也是解空间树中以该结点为根的 子树中 所有结点所对 
应的路长的一个下界。在扩展结点的过程中，一旦发现一个结点的下界不小于当前找到的最短 
路长,则剪去以该结点为根的子树 C 



6 10 8 8 


图 6-2 有向图的单源 M 短路径问题的解空间树 

在算法中，我们还利用结点间的控制关系进行剪枝。例如在上例中，从源顶点 S 出发，经过 
边(路长为 5) 和经过边 c，/i( 路长为 6) 的2条路径到达图 （； 的同一顶点。在该 N 题的解 
空间树中，这2条路径相应于解空间树的2个不同的结点4和由于结点4所相应的路长小 
于结点 B 所相应的路长，因此以结点4为根的子树中所包含的从 s 到/ 的路长小干以结点厶为 
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根的子树中所包含的从 S 到 t 的路长 。因而 可以将以结点 S 为根的了-树剪去这吋称结点4控 
制了结点 

下面给出的算法要找出从源顶点 5 到图 (； 屮所冇其他顶点之间的最短路径，主要利用结 
点控制关系进行剪枝。在一般情况下，如果解空间树中以结点 Y 为根的了•树中所含的解优 f 以 
结点 X 为根的子树中所含的解，则结点 >控制了结点 X ，以被控制的结点1为根的子树吋以 
剪上 -。 

在具体实现算法时，用邻接矩阵忐示所给的图 l 在类 Graph 中用•个二维数组 c 存储图 
^的邻接 矩阵; 用数组 dh 〖己录从源到各顶点的 距离; 用数组 prev E 录从源到各顶点的路径匕 
的前驱顶点。 

由于我们要找的是从源到各顶点的最短路径,所以我们选用最小堆丧示活结点优先队列_ 
最小堆中元素的类瑠为 MinHeapNode 。 该类型结点包含域 〖，用 于记录该活结点所表示的图 C 

中相应顶点的 编号; length 表示从源到该顶点的距离. 

• • ， • • _ • • • • 

template < class Type > 
class Graph I 

friend void main( void); 
public: 

void ShortestPaths(int); 


private； 

int 


prev; 


Type 


dist 




// 图 （； 的顶点数 
// 前驱顶点数组 
//图 G 的邻接矩阵 
//最短距离数组 


template < class Type> 
class MinHeapNode } 
friend Graph < Type> ; 
publio： 

operator int () const I return length;[ 


private: 



//顶点编沒 


Type length; 



// 当前路长 


具体算法可描述 如下: 


template < class Type 

void Graph < Type > : : Shortest Paths (int v) 

!// 单源最短路径问题的优先队列式分支限界法 
//定义最小堆的容置为〗_ 

Minl]eap < MinHeapNode < Type> > H( 1000)； 
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// 定义源为初始扩展结点 
MinHeapNode< Type> E ； 

E,i= v; 

E. length - 0; 

dist[v] = 0i 

// 搜索问题的解空间 

while (true) i 

for (int j= 1; j < = n ； j + + ) 
if ((c[E.i][j] < inf) & & (E.length + c[ E.i][j] < dist[j])) I 

// 顶点 i 到顶点 j 可达，且满足控制约束 

distLj] = E * length + c[E.i]LjJ; 
pre.v[j\! = E.i; 

// 加人活结点优先队列 

MiiiHeapNode < Type > N; 

N • i = j ； 

N.length = distfj]; 

H. Insftrt( N); i 

try iH,DdeteMin(E);i // 取下 扩 展结点 

oatch (OutOfEounds) I break ； I // 优先队列空 


算法开始时创建一个容量为 1 000的最小堆，用于表示活结点优先队列。堆中每个结点的 
length 值是优先队列的优先级。接着算法将源顶点〃初始化为当前扩展结点。 

算法中 while 循环体完成对解空间内部结点的扩展。对于当前扩展结点，算法依次检査与 
当前扩展结点相邻的所有顶点。如果从当前扩展结点 i 到顶点 y 有边可达，&从源出发,途经顶 
点 i 再到顶点彡的所相应的路径的长度小于当前最优路径长度，则将该顶点作为活结点插人到 
活结点优先队列中。完成对当前结点的扩展后，算法从活结点优先队列中取出下一个活结点作 
为当前扩展结点，重复上述结点的分支扩展。这个结点的扩展过程一直继续到活结点优先队列 
为空时为止。算法结束后，数组 dist 返回从源到各顶点的最短距离。相应的最短路径可利用从 
前驱顶点数组 prev 记录的信息构造出来。 

6.3 装载问题 


装载问题已在第5章中详细描述，其实质是要求第1艘船的最优装载。装载问题是一个子 
集选取问题，因此其解空间树是一棵子集树。 


1. 队列式分支限界法 

解装载问题的队列式分支限界法只求出所要求的最优值，稍后将进一步讨论求出最优解,。 
函数 MaxLoading 具体实施对解空间的分支限界搜索。其中队列 G 用于存放活结点表。在队列 
0 中用 weight 表示每个活结点所相应的当前载重量。当 weight = - 1时,表示队列已到达解空 
间树同一层结点的尾部。 
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函数 EnQueue 用于将活结点加入到活结点队列中 。该 函数有 5 t 检丧〗是否等于〜如果 
i : 则表示当前活结点为一个叶结点。由于叶结点不会被进一步扩展，因此不必加人到活 
结点队列中。此时只要检査该叶结点表 7 K 的町行解是否优于当前最优解，并适时更新当前最优 
解。当纟< a 时，当前活结点是一个内部结点，应加人到活结点队列中。 

函数 Max Loading 在开始时将〖初始化为1 , hestw 初始化为0。此时活结点队列为空。将同 
层结点尾部标志 - 1加人到活结点队列中，表示此时位于第1层结点的尾部 t 、Ew 存储当前扩展 
结点所相应的重暈。在 while 循环中，首先检测当前扩展结点的左儿子结点是否为可行结点。如 
果是则调用 EnQueue 将其加人到活结点队列中,然后将其右儿子结点加人到活结点队列中(打 
儿子结点一定是可行结点) 。两个 儿子结点都产生后，当前扩展结点被舍弃。活结点队列中的队 
首元素被取出作为当前扩展结点。由于队列中每一层结点之后都有一个尾部标 i 己-1,故在取 
队首元素时，活结点队列一定不空。当取出的元素是 - 1时，再判断当前队列是否为空。如果队 
列非空，则将尾部标记 - 1加入活结点队列，算法开始处理下一层的活结点。 

》讎_ • • • • • • • • _參馨馨 ■ 讎》_籲馨 • 〜 ■馨瓤 

template < class T ype> 

void EnQueue(Queue< Type> &Q t Type wt^ 

Typc& bestw^ int i T int n) 

1// 将活结点加人到活结点队列 Q 中 
if (i = = n) i// 可行叶结点 

if (wt > bestw) bestw = wt; 1 

elseO.AddCwt); // 非叶结点 


template < class Type> 

Type MaxLoading(Type w[L Type c, int n) 

i// 队列式分支限界法，返回最优载重量 


//初始化 

yueue<Type> Q; 

Q.Add(-l )； 

int i = 1; 

Type Ew = 0, 

bestw = 0; 

// 搜索子集空间树 


// 活结点队列 
//同层结点尾部标志 
//当前扩展结点所处的层 
//扩展结点所相应的载重量 
//当前最优载重量 


while (true) J 

//检査左儿子结点 

if(Ew + w[i] < = c) // x ； i] = 1 

EnQueue(Q，Ew + wri] ， bestw ， i, n); 

// 右儿子结点总是可行的 


EnQueue(Q ， Ew ， bestw ? i, n); // x[i] = 0 
Q. Delete(Ew); // 取下一扩展结点 

if (Ew = = -1) I// M 层结点尾部 


if (Q. IsEmpty( )) return bestw; 

Q.Add( - 1 )； // 同层结点尾部标志 

Q.Delete(Ew )； // 取下一扩展结点 
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// 进人下 



算法 MuLoading 的计算时间和空间复杂性均为0(2。。 

2. 算法的改进 


与解装载问题的回溯法类似，可对上述算法作进一步改进。设 bestw 是当前最 优解; Ew 是 
当前扩展结点所相应的 重董; r 是剩余集装箱的重董。则当 Ew-f bestw 时,可将其右子树 
剪去。 

算法 Max Loading 初始时将 bestw 置为0,直到搜索到第 一 个叶结点时才更新 bestw 。 因此 
在算法搜索到第一个叶结点之前，总有 beslw = 0 ,r > 0,故 Ew + r > bestw 总是成立。也就是 
说,此时右子树测试不起作用。 

为了使上述右子树测试尽早生效，应提早史新 beslw 。 我们知道算法最终找到的最优值是 
所求问题的子集树中所有可行结点相应重 M 的最大值。而结点所相应的重量仅在搜索进人左 
子树时增加。因此，我们可以在算法每一次进人左子树时更新 bestw 的值。由此可对算法作进 
一 步改进如下： 


template < class Type > 

Type MaxLoadirig(Type w[]，Type int n) 

I// 队列式分支限界法，返 h 最优载重童 
//初始化 


Queue < Type > Q; 

Q.Add (- 1); 



Type Ew = 0 ， 
bestw = 0, 
r = 0; 

for (int j = 2; j < = 
r + = w[i]; 

// 搜索子集空间树 


// 活结点队列 
//同层结点尾部标志 
//当前扩展结点所处的层 
//扩展结点所相应的载重量 
// s 前最优载重量 
//剩余集装箱重量 

Hi j 十十 ) 


while (true) \ 

//检杳左儿子结点 

Type wt = Ew + w ： i ] ； // 左儿子结点的重贵 
if Ut < = c) I // 可行结点 

if (wt > bestw) bestw = wt; 

// 加人活结点队列 

if (i < n) Q. Acld( wt); I 

// 检査右儿子结点 

if (Ew + r > bestw & & i < n) 

y.Ada(Ew )； // 可能含最优解 

Q.Delete(Ew); // 取下一扩展结点 

if (Ew =： = - 1) I // 同层结点尾部 
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return besl w ； 

// 同层结点尾部标志 
// 取下一扩展结点 
// 进人 'K 一层 
//剩余集装箱重量 


当算法要将一个活结点加人活结点队列时， wt 的值不会超过 bestw ， 故不必更新 hestw 。 因 
此算法中可直接将该活结点插人到活结点队列中，不必动用函数 EnQueue 来完成插人。 

3. 构造最优解 

为了在算法结束后能方便地构造出与最优值相应的最 优解， 算法必须存储相应子集树中 
从活结点到根结点的路径。为此，可在每个结点处设置指向其父结点的指针，并设置左、右儿子 
标志。与此相应的数据类型由 QNode 表示。 

“• V « • - - .,••• • • - • .. ^ . . . .“ ., r " . , 

template < class Type > 
class Q Noile \ 

friend void EnQueue(Queue < QNode < Type > * > & ， Typ^, 

int. int ， Type, QNode < Type > * , QNode < Type > * int * , bool); 
friend Type MaxLoading( Type # ^ Type, int, int * ); 
private : 

QNode * parent; // 指向父结点的指针 

bool LChHd ; // 左儿子标志 

Type weight; // 结点所相应的载重量 


将活结点加人到活结点队列中的函数 EnQueue 作相应的修改 如下: 

% * • r • r ^ % n % n % • • • r • • 馨 • • • • • • ^ 

template < class Type > 

void EnQueue(Queue < QNode < Type > * > &Q t Type wt, 
int i, int n T Type bestw, QNode < Type > * E ， 

QNode < Type > * &bestF, int bestxL J > bool ch) 
i// 将活结点加人到活结点队列 (？ 中 
if (i = ss n ) |// 可行叶结点 

if (wt = = bestw) J 

// 当 前最优载重垦 

bestK = E; 
bestx[n] = ch;[ 


if (Q. IsEmptyC)) 
Q.Add (- 1 )； 

Q. Delete(Ew); 
i + + ; 

r 一 = w:i] ; 1 


return; l 

// 非叶结点 
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QNode < Type > ^ li; 

b = new QNmle < Type > ; 
b - > weight = wt; 
b - > parent = E; 

b - > LChild - ch; 
Q.Add(b); 


这样，算法就可以在搜索子集树的过程中保存当前已构造出的子集树中的路径指针，从而 
可在结束搜索后，从子集树屮与最优值相应的结点处 h 根结点回溯，构造出相应的最优解。根 
据上述思想设计的新的队列式分支限界法可表述如下。算法结束后， ksu 中存放算法找到的 

最优解。 

.. . • N .. . —— . . . . . . .. 

template < class Type > 

Type MaxLoadingt Type w[ J r Type c, int n，int bestx[]) 

I// 队列式分支限界法，返回最优载重量， bestx 返回最优解 


//初始化 

Queue < QNode < Type > * 

Q.Add(0)j 

int i = 1 i 
Type Ew - 0, 

bestw = 0 ， 
r = 0; 

for (int j = 2j j < = n; j + +) 

r + = w!.ij; 

QNode < Type > * E - 0, 

* bestE; 

// 搜索子集空间树 

while (true)) 

// 检査左儿子结点 

Type wt = Ew + w[i]; 

if (wt < = c) \// 可行结点 

if (wt > bestw) bestw = wt; 


> Q; // 活结点队列 

// 同层结点尾部标志 
//当前扩展结点所处的层 
//扩展结点所相应的载重量 
//当前最优载重量 
//剩余集装箱重量 


//当前扩展结点 
//当前最优扩展结点 


EnQueue(Q, wt, i, n, bestw ， E ， bestE ， bestx, tru«); i 

// 检查右儿子结点 

if (Ew + r > bestw) KnQueue(Q, Ew ， i ， n ， 

bestw, E, bestE, bestx, false); 

Q. Delete(E); // 取下 一 扩展结点 

if(!E) I // 间层结点尾部 


if (Q.IsEmptyO) break; 

Q.Add(0); // 同层结点尾部标志 

Q.Ddete(E); // 取下-•扩展结点 
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i + + ； // 进人下一层 

r-= wLiJ；f // 剩余集装箱重 tt 

>：w = E-> weight; // 新扩展结点所相应的载重 M 

! 

//构造当前最优解 

for (int j=n-1;j>0;j--)f 
bestx^j] = bestE - > LChild; 
bestE = bestE - > parent; 

return bestw; 

I 

一 •一 • 、 • •/ • • •镶 • m m m • ^ m \ m m ^ • • • • f » 丨丨•■丨丨 • • • 零 ■ 

4. 优先队列式分支限界法 

解装载问题的优先队列式分支限界法将活结点表存储于一个最大优先队列中，活结点 x 
在优先队列中的优先级定义为从根结点到结点 X 的路径所相应的载重量再加上剩余集装箱的 
重量之和。优先队列中优先级最大的活结点成为下一个扩展结点。优先队列屮活结点 X 的优先 
级为 x . uweight 。 以结点 X 为根的子树中所有结点相应的路径的载重量不超过 X . uwdghl 。 子集 
树中叶结点所相应的载重量与其优先级相同。因此在优先队列式分支限界法中 ，一 旦有一个叶 
结点成为当前扩展结点，则可以断言该叶结点所相应的解即为最优解，此时可终止算法。 

上述策略可以用两种不同方式来实现。第一种方式在结点优先队列的每一个活结点中保 
存从解空间树的根结点到该活结点的路径，在算法确定了达到最优值的叶结点时，就在该叶结 
点处同时得到相应的最优解。第二种策略在算法的搜索进程中保存当前已构造出的部分解空 
间树，这样在算法确定了达到最优值的叶结点时，就可以在解空间树中从该叶结点开始向根结 
点回溯，构造出相应的最优解。在下面的算法中，我们采用第二种策略 c 

我们用 一 个兀素类型为 HeapNode 的最大堆来表示活结点优先队列 。 其中 uweighl 是活结 
点优先级(上 界）; level 是活结点在子集树中所处的层 序号; p tr 是指向活结点在子集树中相应 
结点的指针。子集空间树中结点类型为 bbnode 0 

template < class Type > class HeapNode^ 
class bbnode i 

friend void Add Live IV ode ( Max Heap < IleapNode < int > > &▼, bbnode ^ , 

int, bool, int); 

friend int MaxLoading(int * , int t int, int * ); 

friend class Adjacency Graph i 

private: 

bbnode * parent; // 指向父结点的指针 

hool LChild; // 左儿子结点标志 

: . 

template < class Type > 
class HeapNode | 

friend void AddLive N ode (Max Heap < HeapNode < Type > > &, bbnude ^ , 
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Type, bool ， int); 

friend T>j>e Max] ， oailing(Type 开， Typc, int, int * ); 
public ： 

operator Type () ⑶ nsl 1 return uweight;, 
private ： 

bbnocl^ ^ ptr; // 指向活结点在子集树中相应结点的指针 

Type uwHghti // 活结点 优先级 ( 上界） 

int leveli // 活结点在+集树中所处的层序号 

■ _ _ 參 丨丨春 ■ 

在解装载问题的优先队列式分支限界法中，函数 AddLiveNode 以结点元素类型 bbnode 将 
一 个新产生的活结点加人到子集树中，并以结点元素类型 lleapNo ‘将这 个新结点插人到表示 
活结点优先队列的最大堆中。 

• • • • • • • • ■參雜 ■ • \ ^ 9 • % • 

template < class Type > 

void AddLiveNode( MaxHeup < HeapNode < Type > > &H, bbnode * E ， 

Type wU bool int lev) 

I// 将活结点加入到表示活结点优先队列的最大堆 H 中 

bbnode * b = new bbnode; 
b - > parent - E; 

b- > LChild = ch; 

HeapNode < Type > N; 

N.uweight = wt; 

N.level - lev; 

N.ptr = b; 

H.Insert(N); 


函数 MaxLoading 具体实施对解空间的优先队列式分支限界搜索。在函数 MaxLoading 中, 
定义最大堆的容量为1 000,即在算法运行期间,活结点优先队列最多可容纳1 _个活结点。 

第 Z + 1 层结点的剩余重量 r [/] 定义为 i {/] = 2 w [ y ]。 变量 s 指向子集树中当前扩展结点， 

Ew 是相应的重量。算法开始时 ， i = l，Ew = oY 子集树的根结点是扩展结点。 

while 循环体产生当前扩展结点的左右儿子结点 J 卩果当前扩展结点的左儿子结点是可行 
结点，即它所相应的重量未超过船载容量，则将它加人到子集树的第 i + !层上，并插人最大 
堆。扩展结点的右儿子结点总是可行的，故直接插人子集树的最大堆中。接着算法从最大堆中 
取出最大元素作为下一个扩展结点。如果此时不存在下一个扩展结点，则相应的问题无可行 
解。如果下一个扩展结点是一个叶结点，即子集树中第 a + 1层结点，则它相应的可行解为最优 
解。该最优解所相应的路径可由子集树中从该叶结点开始沿结点父指针逐步构造出来 。具 体算 
法可描述 如下： 


template < class Type > 

Type Max Load in g( Type w[」，Type c，int n, int beslxL 」） 

i // 优先队列式分支限界法，返回最优载重童返回最优解 
//定义最大堆的容量为1000 
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McixJl^ap < HeapNcwle < Type > > H( 1000); 

// 定义剩余重量数组 r 

Type * r - new Type f n + 1 ^; 
r[n」= 0; 

for (int j = n - 1; j > 0; j — ) 
r[jj = rLj + 1 ] + wLj + l]; 

// 初始化 

inti = 1; // 当前扩展结点所处的层 

bbnode = 0; // 当前扩展结点 

Type Ew . 0; // 扩展结点所相应的载蓽量 

//搜索7■集空间树 
while (i ! = n + 1) |// 非叶结点 
//检査当前扩展结点的儿子结点 
if(Ew + wLiJ < = c) V/左儿子结点为可行结点 
AddLiveNode(H, E，Ew + w[i] + r[_i], true, i + 1); f 
// 右儿+结点 

AddLiveNode(H, E, Ew + r[ij, false, i + 1); 

// 取下- 扩展结点 

HeapNode < Type > N; 

H.DeWteMax(N); // 非空 
i = N. level; 

E = N.plrj 

Ew = N.uweight - r[i - 1J ； 

! 

// 构造当前最优解 

for (int j = n; j > 0; j --) J 
bestx[jj = E - > LChild; 

C = E - > parent; 

J 

I 

return Ew; 


算法中预先估计最大堆的容暈 （1 000) 是由于用数组来实现最大堆所需要的:如果改用基 
于指针的优先队列实现方式则不必预先设置优先队列的容量。 

如果我们用变量 bestw 来记录当前子集树中可行结点所相应的重量的最大值，则当前活 
结点优先队列中可能包含某些结点的 uweiglu 值小于 bestw 。 易知以这些结点为根的子树中肯 
定不含最优解。如果不及时将这些结点从优先队列中删去，则一方面耗费优先队列的空间资 
源，另一方面增加执行优先队列的插人和删除操作的时间。为了避免产生这些无效活结点，可 
以在活结点插人优先队列前测试 uweight > bestw 。通 过测试的活结点才插人优先队列中。这 
样做可以避免产生一部分无效活结点。然而随着 bestw 不断增加，插人时还是有效的活结点， 
可能变成无效活结点。因此，为 r 及时删除由于 bestw 的增加而产生的无效活结点，即使 
u weight < bestw 的活结点，要求优先队列除了支持 Insert ， Delete Max 运算外 * 还支持 DeleteM in 
运算。这样的优先队列称为双端优先队列。有多种数据结构可有效地实现双端优先队列。 
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6.4 布线问题 


印刷电路板将布线区域划分成 n x m 个方格阵列如图 6-3 U ) 所示。精确的电路布线问题 
要求确定连接方格 a 的中点到方格6的中点的最短布线方案。在布线时，电路只能沿直线或直 
角布线，如图 6-3( b ) 所示。为了避免线路相交，已布了线的方格做了封锁标记,其他线路不允 
许穿过被封锁的方格。 



( a ) 布线区域 



图 6-3 印刷电路板布线方格阵列 

下面我们讨论用队列式分支限界法来解布线问题。布线问题的解空间是一个图。解此问题 
的队列式分支限界法从起始位置 a 开始将它作为第一个扩展结点。与该扩展结点相邻并且可 
达的方格成为可行结点被加入到活结点队列中，并且将这些方格标记为1,即从起始方格 a 到 
这些方格的距离为1。接着，从活结点队列中取出队首结点作为下一个扩展结点，并将与当前 
扩展结点相邻且未标记过的方格标记为2,并存人活结点队列。这个过程一直继续到算法搜索 
到目标方格6或活结点队列为空时为止。 

在实现上述算法时,首先定义一个表示电路板上方格位置的类 Position ， 它的两个私有成 
员 row 和 cx > l 分别表示方格所在的行和列。在电路板的任何一个方格处，布线可沿右、下、左、上 
4个方向进行。沿这4个方向的移动分别记为移动0、1，2,3。在表 6- 1中， offset [ i ]. mw 和 
oihet [ i ], col(i = 0，1，2,3)分别给出沿这4个方向前进1步相对于当前方格的相对位移。 


表 6-1 移动方向的相对位移 


移动 f 

方向 

* 

of feel [ i j.rovf 

offset: i 1. col 

0 

右 1 

0 

1 

; 1 

I 

下 

1 

l 

0 

2 

左 

0 

-1 

3 

上 

- 1 

0 


在实现上述算法时，我们用一个二维数组 grid 表示所给的方格阵列。初始时， grid [ i ][>] 
= 0,表示该方格允许布线，而 grid [〖][ y ] = 1表示该方格被封锁，不允许布线。为了便于处理 
方格边界的情况，算法在所给方格阵列四周设置一道“围墙”，即增设标记为 “ r 的附加方格。 
算法开始时测试初始方格与目标方格是否相同。如果这2个方格相同则不必计算，直接返回最 
短距离0,否则算法设置方格阵列的“围墙”，初始化位移矩阵 affset 。 算法将起始位置的距离标 
记为2。由于数字0和1用于表示方格的开放或封锁状态，所以在表示距离时不用这2个数字， 
因而将距离的值都加2。实际距离应为标记距离减 h 算法从起始位置 start 开始，标记所有标记 
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距离为 3 的方格并存入活结点队列，然后依次标记所有标记距离为 4, 5,…的方格至到达 
目标方格 Hni , h 或活结点队列为空时为止。具体算法町描述 如下： 


bool FindPath (Position start. Position finish, 

i 【 it& PathLen，Posirioti * &path) 

\// 计算从起始位置 start 到目标位置 fmi 吐的最短布线路径 
// 找到最短布线路径则返回 tme ， 否则返回 false 

if ((start-row = = finish, row) & & 

(start. col = = finish. ( ， ul) ) 

|PathLen = 0; return true; ! 

// 设置方格阵列 “ 围墙 ” 

for (int i = 0; i < = m + 1; i + +) 

gridt0.fi] = grid[n + l’‘i] = ]； // 顶部和底部 
for (int i =： 0 ； i < = n + 1; i + + ) 

grid[iX0j = grid[i][m + 1 ] = 1 ;// 左翼和右翼 
// 初始化相对位移 

Position offset [ 4 ] ； 

offsetLO] .row = 0; offset[0] .col = 1; // 右 

offaet[ 1 ] ♦row = 1 ； offset[ 1 」 • col = 0; // 下 

offset[2] • row = 0; offset l 2J .col = - 1; // 左 

offset[3] • row = - 1; offset:3] ， col = 0; // 上 

int NumOfNbrs = 4; // 相邻方格数 

Position here ， nbr; 
here ♦row = start, row; 
here-col = start, col; 
grid[start, row] [start-col」= 2; 

// 标记可达方格位置 

LinkedQueue < Position > Q; 

do j // 标记可达相邻方格 

for (int i =： 0; i < NumOfNbrs; i + +) i 
nbr.row - here, row -f offset[i] . row; 
nbr-col = here,col + offset[iJ .col; 
if (grid[nbr* row][nbr.col] = = 0) i 

// 该方格 未标记 

grid[nbr. rowjLnbr.col] 

=gridL here, row] [here, col] + 1; 
if ((nbr.row = = finish.row) & & 

(nbr.col = = finish.col)) break; // 究成布线 

Q. Add(nhr) ； \ 

1 

I 

// 是否到达目标位置 finish? 

if ((nbr.row = = finish.row) & Si 

(nbr.col = - finish, col)) break; // 完成布线 
// 活结点队列是否非空 
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if ( Q . JsEmptyC ) ) return false ; // X 解 

Q - Mcte ( herr ): // 取下“个扩展结点 

I whik( true); 

// 构造最短布线路径 

PathT.en = grid ^ finish,rowJ!.finish . oo (] - 2\ 
path - new Position [ Pathl - en ]; 

// 从 H 标位置 finish 开始向起始位置回溯 

here = finish ; 

for (iut j = PathLen - = 

path [ j ] = here ; 

// 找前驱位置 

for (int i = 0; i < NiimOfNbrs; i + + ) ! 
nbr.row = here.row + offset[ i ] ， row; 
nbr.col = here, col + offset Li]-col; 
if (grid[ nbr. rowJ [ nbr. col] = = j + 2) break; 

I 

here = nbr ; // 向前移动 

I 

t 

return true ; 

； 

，■籲參_ _ • ^ % % - 
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图 64 是在一个 7 x 7 方格阵列中布线的例子。其中起始位置是 a = (3,2)，0标位置是 
: ( 4 , 6 )，阴影方格表示被封锁的方格。当算法搜索到目标方格6时，将目标方格6标记为 
从起始位置 a 到6的最短距离。本例中，《到6的最短距离是9。要构造出与最短距离相应的最 
短路径，我们从目标方格开始向起始方格方向回溯，逐步构造出最优解。每次向标记距离比当前 
方格标记距离少1的相邻方格移动，直至到达起始方格时为止。在图 6~4( a ) 中，我们从目标方格6 
移到 (5,6) ，然后移至( 6 ,6)， … ，最终移至起始方格，得到相应的最短路径如图 6-4( b ) 所示。 



( a ) 标记距离 （ b) 最短布线路径 

图 6-4 布线算法示例 

由于每个方格成为活结点进人活结点队列最多1次，因此活结点队列中最多只处理 
0{ mn ) 个活结点。扩展每个结点需 0(1) 时间，因此算法共耗时 0(〃 m )。 构造相应的最短距 
离需要 0 U ) 时间，其中 Z 是最短布线路径的於度。 
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6.5 0-1 背包问题 


在解 chi 背包问题的优先队列式分支限界法中，活结点优先队列中结点兀素 / v _ 的优先级 
由该结点的上界函数 Bound 计算出的值 uprofit 给出。该 匕界函 数已在 W 论解 0 M 背包问题的回 
溯法时讨论过。子集树中以结点 N 为根的子树中任一结点的价值不超过 N . pmfh 。 因此我们用 
一个最大堆来实现活结点优先队列，堆中元素类型为^?從 | ^ 0 士，其私有成员冇111^(^1，{^0「〖1， 
weight , level 和 ptr 。 对于任意一个活结点 N ， N . weight 是结点 N 所相应的 重量 ; N . prdit 是 IV 听 
相应的 价值; N . upmfit 是结点 N 的价值上界，最大堆以这个值作为优先级 T 集空间树中结点 
类型为 bbnode - 

_ ^ • • • • • 

class Object j 

friend ini Knapsack(int * , int * ， int ， int, int ^ ); 
public: 

int operator < = (Object a) von^i 
\ return (d > 二 £i.d);) 
privaLe ： 

ii)t ID; 

float d; // 单位重量价值 



template < clash Typew, cla^ Typep > class Knap ； 
class bbnode ] 

friend Knap < inUint > ; 

friend int Knapsack (int * , int * ， int, int, int ^ ); 
private ： 

bbnode * parent; // 指向父结点的指针 

bool LChild; // 左儿+结点标志 


templnti? < class Typew, class Typep > 
class HeapNode { 

frierul Knap < Typew,Typep > ; 
public : 

operator Typep () const i return uprofit; \ 


private ： 

Typep uprofit, 
profit; 

Typew weight; 
int level; 
bbnode * ptr; 



// 结点的价值 h 界 

// 结点所相应的价值 

//结点所相应的重童 

// 活结点在+集树中所处的层序号 

//指向活结点在子集树中相应结点的指针 
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这里用到的类 Knap 与解0-〗背包问题的回溯法中用到的类 Knap 十分相似。它们的区别 
是新的类中没有成员变量 best p ，而增加了新的成员 besUjestxD ] = 1当且仅当最优解含有 
物品“ 


template < class Typew，class Typep > 
class Knap ' 

friend Typep Kriapsaok( Tvpep * ， Tjpe 
public r 

T ypep Max Knapsack (); 


， Typew, int, int * ); 


private: 

MaxHeap < HeapIVode< Typep ， Typew > > ^ 
Typep Bound(int i); 

void Add Li veNodef Typep up, Typep q)，Type 


H; 


， bool ch，int level); 


bbnyde ^ E; 



mt n; 

T yp^w ^ w 

Typep 
Typcvr cv ；； 
Typep cpi 
int * bestx; 


// 指向扩展结点的指针 
// 背包容盘 
//物品总数 
//物品重量数组 
//物品价值数组 
//当前装包重量 
//当前装包价值 
//最优解 


上界函数 Bound 汁算结点所相应价值的上界。 


template < class Typew f cl^a Typep > 

Typep Knap < Typew ， Typep > :: Bound(int i ) 

i // 计算结点所相应价值的上界 


Typew cleft = c - cw; // 剩余容量 
Typep b = cp; // 价值 .t 界 

// 以物品单位重量价值递减序装填剩余容量 


while (i < = n & & w[i] < = cleft) \ 



w[i]; 



// 装填剩余容量装满背包 

if (i < = n) b + = pfij/^Ti] * oleit; 


return b ; 




函数 AddLiveNode 将一个新的活结点插入到子集树和优先队列中。 


template < class Typep, class Typew > 
void Knap< Typep ， Typew〉 ：: AddLiveNode(Typep up, 
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Typ^fi op, Typew cw* huol ch，int lev) 

// 将一个新的活结点插人到 了集 树和最火堆 H 中 

bbtKKle M> = new bbnodti ； 
h- > parent = E; 
b- > LChild - cli; 

HeapNude< Typep, Typew > M ； 

N. uprofit =： up; 

N-profit = cp ； 

N ， weight = cwi 

N. level = lev; 

N.ptr = b ； 

H- > Insert(x\),- 


函数 MaxKmipack 实施对子集树的优先队列式分支限界搜索。其中假定各物品依其单 
位重量价值从大到小排好序。相应的排序过程可在算法的预处理部分完成。 

算法中 E 是当前扩展结点 w 是该结点所相应的 重量; Cp 是相应的 价值; Up 是价值上界 s 
算法的 while 循环不断扩展结点，直到子集树的一个叶结点成为扩展结点时为止。此时优先队 
列中所有活结点的价值上界均不超过该卟结点的价值 c 因此该叶结点相应的解为问题的最 
优解。 

在 while 循环内部，算法首先喧查当前扩展结点的左儿子结点的可行性:，如果该左儿子结 
点是可行结点，则将它加入到子集树和活结点优先队列中。当前扩展结点的右儿子结点一定是 
可行结点，仅当右儿子结点满足上界约束时才将它加人子集树和活结点优先队列。算法 
Max Knapsack 具体描述如下： 

^ ri . r ,..^ ••- ••- • • • V ， r \_ • • • • j % • % • t . 

template< class Typew, class Typep > 

Typep Knap < Typew, Typep > :: MaxKaapsack() 

!// 优先队列式分支限界法，返回最大价值， bestx 返回最优解 
//定义最大堆的容量为 1000 

H = new Max Heap < He!ip!Vo(Ie< Typep, Typew > > (1000); 

// 为 be^tx 分配存储空间 

bestx - new ini L n + 1 ]; 

// 初始化 

int i = 1; 

E ~ 0; 

cw == cp = 0; 

Typep bestp = 0; // 当前最优值 

Typ^p up = Bound(l); // 价值上界 
// 搜 索子集 空间树 
while (i ! = n + l) {// 非叶结点 
// 检査当前扩展结点的左儿子结点 

Typew wt = cw + w[ij ； 

if(wt < = c) I // 左儿子结点为可行结点 - 
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if (cp+ pi i I > bt^stp) bcstp = cp+ p[i]; 

AddLiveNode(up ¥ cw + w[i] , trut 1 1 i + 1); I 

up = Bound(i 十 1); 

// 检查 i 前扩展结点的右儿 p 结点 
if (up > = besLp ) // 心子树可能含最优解 

Adn>iv^\oile(up- cp t cw, false, i + 1 ); 

// 取下…扩展结点 
HeapNode < Typep, Typew> N; 
fl- > DeleteMax( N); 

K = N.ptr; 
cw = i\. weight; 
cp - N.profit; 
up - N. uprafit; 
i = N. level; 

參 

I 

// 构造当前最优解 

for (int j n ; j > 0; j- - ) J 

bestufjj = E- > LChi\d; 

E = E - > parent; 

I 

return Cp ； 

，瓤 馨馨 嫌 •瓤 ■_ , • _ 參參鬱 • ■參 參 

下面的函数 Knapsack 完成对输入数据的预处理。其主要任务是将各物品依其单位重量 
价值从大到小排好序。然后调用函数 MaxKiiapsack 完成对子集树的优先队列式分支限界 
搜索。 

_ 气 J J k ▲ •> • * \* 藝 __ 9 S% \ ♦ S 、 

template < class Typew y dass Tvpep> 

Typep Knapsack(Typep p[ ] t Typew w[]，Typew e t int n，int bestx[J) 

i // 返回最大价值， bestx 返回最优解 
// 初始化 

Typew W ^ 0; // 装包物品重童 

Typep P =： 0; // 装包物品价值 

//定义依单位重童价值排序的物品数组 

Object * Q = new Object [nj; 
for (int i = ];i<=n;i++)i 

// 单位重量价值数组 

Qri - i].id = i ； 

Q[I - J ] < d = 1 .0 * pLi.i/w[iJ; 

P + = plij ； 

W + = wLi.l ； 

! 

if (W < = c ) return P ; // 所有物品装包 

// 依单位電量价值排序 
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Son(Q,n); 

// 创建类 Knap 的数据成员 

Knap < Typew 、 Typep > K; 

K, p : new T ypep [ n + 1 」 ； 

K. w := new Typ^w Ln+ 1 ; 
for (int i^l;i<-n;i++)j 

K, P [i] = pi y[i- 

K ， .[i] = w[Q[i-ll.lD； ; 

I 

¥ 

I 

K,cp = 0; 

K.cw - 0; 

K-c = ci 
K. ii ~ n j 

// 阔用 MaxKnapsack 求问题的最优解 
Typepbestp = K. Max Knapsack ()； 
for (int j =1 ; j < = n ； j+ + ) 
bestxLQ[j - lJ.ID] = K,bestx[j ]； 
delete [J Q; 
delete [ ] K. w; 
delete [ ] K. p ； 

delete [ ] K. bestx; 
return bestp j 


6.6 最大团问题 

最大团问题的解空间树也是一棵子集树。解最大团问题的优先队列式分支限界法与解装 
载问题的优先队列式分支限界法相似。算法构造的解空间树中结点类型是 bhmi ( k ; 活结点优 
先队列中元素类型为 CliqueNode c 每一个 CliqueNode 类型的结点都以变量 ( n 表小与该结点相 
应的团的顶 点数; un 表示该结点为根的子树中最大顶点数的 上界; level 表示结点在子集空间 
树中所处的 层次； ch 是左、右儿子结点标记。当 ch =〖时，表示该结点是其父结点的左儿子结 
点，当 oh = 0时是*儿子 结点: ptr 是指向解空间树中相应结点的指针。我们用 
cn + n - level + 1 作为顶点数上界 un 的值。由此，可省去一个变量 cm 或 〖 evei ， 因为从 un 的值 
可推出省去变量的值实际上也是优先队列中元素的优先级。算法总是从活结点优先队列 
中抽取具有最大 un 值的元素作为下一个扩展元素。 

4^1 9 • • I I II • ^ • # • • • • • 

class bbflode J 

frien(i cJass Clique ； 
private : 

bbnodc ^ parent; // 指向父结点的指针 
bool LChild; // 左儿 T 结点标志 
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class CliqueNodtf i 
friend class Clique ； 
public ： 

operator int ( ) const I return un; | 


private ： 

int cn, // 当前团的顶点数 

mi ， // 当前团最大顶点数的 L 界 

levd; //结点在子集空间树中所处的层次 

bbnode ^ptr; //指向活结点在子集树中相应结点的指针 


在具体实现时，用邻接矩阵表示所给的图 G 在类 Clique 中用一个二维数组 a 存储图 C 的 
邻接矩阵。 


class Clique | 

friend void main(void); 
public ： int 8BMaxClique(int 门）； 
private: 

void AdclLiveNode( MaxHeap < Clique Node > &H ， 

int ⑶， int un, int le\el y bbnode E[ ], bool ch); 

int * * a, // 图 G 的邻接矩阵 
n; // 图 G 的顶点数 


算法中函数 AddUveNode 的功能是将当前构造出的活结点加人到子集空间树中并插入活 
结点优先队列中。 

void Clique： : AddLiveNode( MaxHeap < CliqueNode > 

&H, int cn, int un，int level，bbnode E[]，bool eh) 

)// 将活结点加入到子集空间树中并插人最大堆中 

bbnode * b = new bbnode; 
b - > parent = E; 
b - > LChild = cK; 

CliqueNode N; 

N*cn - cn; 

N-plr = b; 

N.un - un; 

N.level - level; 

H. Insert( N); 


函数 BBMaxClique 具体实现对子集解空间树的最大优先队列式分支限界搜索。子集树的 
根结点是初始扩展结点。对于这个特殊的扩展结点，其 cn 的值为0。变量 i 用于表示当前扩展 
结点在解空间树中所处的层次。因此，初始时扩展结点所相应的 i 值为1，当前最大团的顶点数 


• 184 • 







存储 T 变量 bestn 屮： 

在 while 循环中，我们不断从活结点优先队列中抽取当前扩展结点并实施对该结点的扩 
展 D whUe 循环的终止条件遇到子集树中的一个叶结点(即 n + 1层结点）成为气前扩展结点。 
对于子集树中的一个叶结点，我们有 un =⑶。此时活结点优先队列中剩余结点的 uri 值均不超 
过当前扩展结点的 un 值，从吋进-步搜索不可能得到更大的团，此时算法 Li 找到-个最优解。 

算法在扩展一个内部结点时，首先考察其左儿子结点。在左儿子结点处，将顶点；加入到 
当的团中，并检查该顶点与当前团中其他顷点之间是否有边相连当顶点纟与当前团中所有顷 
点之间都有边相连，则相应的左儿子结点是吋行结点，否则就不是可行结点。为 r 检测左儿子 
结点的可行性，算法从当前扩展结点开始向根结点回溯，确定当前团中的顶点，同时检查当前 
团中的顶点与顶点 i 的连接情况、如果左儿 T 结点是一个可行结点，则将它加人到子集树中并 
插人活结点优先队列。接着算法继续考察当前扩展结点的右儿子结点。当 un > besh 时，右？ 
树中可能含有最优解,此时将右儿子结点加人到子集树中并插人到活结点优先队列中。 

由于每一个图都有最大团，因此在从最大堆屮抽取极大元素时不必测试堆是否为空。算法 
的 while 循环仅当遇到一个叶结点时退出。 

• v v \ r r • r r • r • r z • • • • ^ » • • - • • • • ****** ••- ••馨 • • ••參 • • ’羲 * 

int Clique： : BBMaxClique(int be»U[]) 

I // 解最人团问题的优先队列式分支限界法 
// 定义最大堆的容量为 1000 

Max Heap < CliqueNode > H( 1000); 

// 初始化 
bbtiode * E = 0; 

int i = 1 ， 
on = 0 t 
bestn = 0; 

// 搜索 T 集空间树 

while (i ! = n + 1) !// 非叶结点 

// 检查顶点 i 与当前团中其他顶点之间是否有边相连 

bool OK = true; 
bbnode * B = E; 

for (int j = i - l; j > 0; B z= B - > parent f j —— ) 
if (B - > IXhild & & a [i] ； j] = = 0) f 
OK - false; 
brt^k; I 

if (OK) V / 左儿子结点为町行结点 

if (cn + 1 > bestn) bestn = cn + 1; 

AddLiveNode(H, cn+ 1 ， cn+n^i + l，i + 1 ， E, true) ； | . 

if (cn + n - i > = bestri) 

// 右 T 树可能含最优解 

AddLiveNode(H, cn. cn + n - i，i + 1 ， F:, false); 

// 取下一 f 展结点 

CliqueNode N; 

H,DeleteMax(N)i // 堆非空 
E = N.ptr; 
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cn = N, cn; 

i = N . level; 

% 

\ 

t 

// 构造当前最优解 

for (int j = n; j > 0; j —— ); 
bestx[j] = E - > T.Child; 
E = E - > parent? 

I 

return bestu; 


6,7 旅行售货员问题 

旅行售货员问题的解空间树是一棵排列树。与前面关于子集树的讨论类似，实现对排列树 
搜索的优先队列式分支限界法也可以有两种不同的实现方式。其一是仅使用一个优先队列来 
存储活结点。优先队列中的每个活结点都存储从根到该活结点的相应路径 c 另一种实现方式是 
用优先队列来存储活结点，并同时存储当前已构造出的部分排列树。在这种实现方式下，优先 
队列中的活结点就不必再存储从根到该活结点的相应路径。这条路径可在必要时从存储的部 
分排列树中获得。在下面的讨论中我们采用第一种实现方式。 

我们用邻接矩阵表示所给的图在类 Traveling 中用一个二维数组 a 存储图 G 的邻接 

矩阵。 

■鬌 ■ •■馨 • 齡 • • ^ • % • • • • • • • • • • J ^ ^ J J k 1 春 ■■春 ’ 产"产 

template < dass Type > 
class Traveling < 

friend void mairi( void); 
public : 

Type BBTSP(int v[]); 
private: 

int n; // 图 G 的顶点数 

Type ^ // 图 G 的邻接矩阵 

NoEdge, // 图 G 的无边标志 

cc , // 与前费用 

bestci // 当前最小费用 

i ; 
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由于我们要找的是最小费用旅行售货员回路，所以我们选用最小堆表示活结点优先队列。 
最小堆中元素的类型为 MinHeapNude 。该类型结点包含域 X ， 用于记录当前解^表示结点在排 
列树中的层次，从排列树的根结点到该结点的路径为 x [0 u ]， 需要进一步搜索的顶点是+ 
_ l ； Uc 表示当前费用 , kmt 是子树费用的下界， rcost 是 xbw _ 1] 中顶点最小出边费用 
和。具体算法町描述 如下： 


template < class Type > 
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class MinHeapNode 1 

friend Traveling < Type > ; 
public ： 

operator Type ( ) const ; return lcost; ! 
private ： 

Type lcost, // 了 ' 树费用的下界 

CC, // 当前费用 

tf^)St ; // x[s ： n - 1 j 中顶点最小出边费用和 

int s, // 根结点到当前结点的路径为 x[0：sj 

// 需要进一步搜索的顶点是 l ： n- lj 


算法幵始时创建一个容量为1 000的最小堆，用于表示活结点优先队列。堆中每个结点的 
lcost 值是优先队列的优先级。接着计算出图中每个顶点的最小费用出边并用 Minout i 己录。如 
果所给的有向图中某个顶点没有出边，则该图不可能有回路,算法即告结束。如果每个顶点都 
有出边，则根据计算出的 Minoiit 作算法初始化。算法的第1个扩展结点是排列树中根结点的惟 
一儿子结点(图 5-3 中结点5)。在该结点处，已确定的回路中惟一顶点为顶点 U 因此，初始时 

n 

有 j = 0 ， x[0] = l ， x[l:a - 1] = (2,3 ,…， ra)，cc = 0 且 rcost = 乂 Minout[ i m 。算法屮用 beslc 

J - s 

记录当前最优值，初始时还没有找到回路，故 bestc = NoF 』 ge 。 


template < class Type > 

Type Traveling < Type > :: BBTSP(int v[]) 

(// 解 旅行售货员问题的优先队列式分支限界法 
//定义最小堆的容量为 1000 
M in Heap < M in Heap Node < Type > > H( 1000); 

Type * MinOut = new Type [n -f 1 ]； 

// 计算 MinOut[i]= 顶点 i 的最小出边费用 
Type MinSum = 0; // 最小出边费用和 

for (int i=l ； i<=n;i+ + )| 

Type Min = NoEdge; 
for (int j = 1; j < =n; j + + ) 
if (a[i] [jj ! = NoEdge & & 

(a[i]Lj] < Min j 丨 Mi» = = NoEdge)) 
Min = a[i][j]; 

if (Min r = NoEdge) return NoEdge; // 无回路 
MinOut[i] = Min; 

f 

MinSum + - Min; 

I 

// 初始化 

MinHeapNode < Type > E{ 

E. x - new int [ n]; 

for (int i = 0 ； i < n; i + + ) 

E,x[i] = i + 1; 
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E.s = 0; 

K. uv = 0 ； 

E.rcost =： MinSum; 

Type bestc = 

// 搜索排列空间树 
while (E.s < n - 1) I// 非叶结点 
if (E► s = = n - 2) !// 当前扩展结点是叶结点的父结点 
//再加 2 条边构成回路 
//所构成回路是否优于当前最优解 

if(aLE.x"n-2]][E.x[n~iJ] ! = NoEdge & &. 
a[K.x[ n - 1 ] JL 1 J ! = NoEdge & & (E.cc + 

x[ n - 2]]L E,x[n - 1 ]] + a[ K. xf n - 1 」 JL1J 
< bestc I I bestc - - NoEdge)) i 

// 费用更小的回路 

bestc = + a[E.x[n - 2]][E.x[n - l]] + a.E.x[n - 1 ]][ 丨 ]; 

E.cc = bestc; 

E. Icost = bestc; 

E.s + + ; 

H, Insert(E); | 

else delete [] E.x;i // 舍弃扩展结点 
else I// 产生当前扩展结点的儿子结点 

for (int i = E.s + 1; i < n; j + + ) 
if (a[^.x[E,s]JLE.x ： i]] ! = NoEdge) f 
// 可行儿子结点 

Typecc = E ■ cc 十 a[E-x[E-s_] L E-x[_i]]; 

Type rcost - E.rcost - Min()ul[ E.x[ E.sJ J; 

Type b = cc + rcost; // 下界 

if (b < bestc I I bestc = =： NoEdge) i 

// 子树可能含最优解 
// 结点插人最小堆 

MinHeapNode < Type > N; 

N.x = new int [ n 」； 

for (ini j = 0; j < n; j + + ) 

N.x[；J = F.x[j ]； 

N.x[E.s+ I] = E.xlIJj 
N .x[i] = E.x[E，s + 1 ] j 
N .cc = cc; 

N.s = E.s + 1; 

N. Icost = b; 

N. roust = rcost; 

H.Insert(N);j 

I 

delete [ ] F“x; i // 完成结点扩展 
try )H.DeleteMin(E);! // 取下-扩展结点 
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catch (OulOfBoands) i break; • // 堆已 f 

I 

if (bestc = = NoK<lg«) return NoEdge; // 无回路 

// 将最优解复制到 V:l:n] 

for (int i = 0; i < n; i + + ) 
vri + 1 ] = E. x[i]; 

while (true 〉 彳 // 释放最小堆中所有结点 
delete [j K_x; 
try jH.D eleteMin(E); I 
calcK (OutOfBounds) i break; 

I 

f 

return bestc; 

0 

/ 

• • • • •• • - -- • ••- - • • • • • • ， • • • 

算法中 whiM 盾环的终止条件是排列树的一个叶结点成为当前扩展结点。当 5 = n -\ ni , 
已找到的回路前缀是 x [ 0 ：n - 1]，它已包含图 C 的所有个 顶点: ，因此，当 s = n - \ 时，相应 
的扩展结点表示一个叶结点。此时该叶结点所相应的回路的费用等于⑺和 Icost 的值。剩余的 
活结点的 icust 值不小于已找到的回路的 费用。 它们都不可能导致费用更小的回路。因此已找 
到的叶结点所相应的回路是一个最小费用旅行售货员回路，算法可以结束 

算法的 wh 如循环体完成对排列树内部结点的扩展。对于当前扩展结点，算法分两种情况 
进行处理。首先考虑$ = 2的情形。此时当前扩展结点是排列树中某个叶结点的父 结点如 

果该叶结点相应一条可行回路且费用小于当前最小费用，则将该叶结点插人到优先队列中，否 
则舍去该叶结点。 

当$ < n -2 时，算法依次产生当前扩展结点的所有儿子结点。由于当前扩展结点所相应 
的路径是 x[0^]， 其可行儿子结点是从剩余顶点 x[s + 1: n - 1] 中选取的顶点 x[i]， 且 (x[i]， 
x[;]) 是所给有向图中的一条边 5 对于当前扩展结点的 每一个 可行儿子结点，计算出其前缀 
(x[0： 5 ],x[i]) 的费用⑶和相应的下界 kmt。 当 host < bestc 时，将这个可行儿子结点插入到 

活结点优先队列中。 

在所给的有向图没有回路时，算法返回 NoEdge 。 否则返回找到的最小费用，相应的最优解 
由数组 v 给出。 

6.8 电路板排列问题 


电路板排列问题的解空间树也是一棵排列树。我们采用优先队列式分支限界法找出所给 
电路板的最小密度布局。算法中用一个最小堆来表示活结点优先队列。最小堆中元素类型是 
Board Node。 每一个 BoardNode 类型的结点包含域 x， 用来表示结点所相应的电路板排列； s 表示 
该结点已确定的电路板排列又[1:5];0(1表示当前密度;00\^[)]表本 X[1:A ] 中所含连接块/中 
的电路板数。具体算法描述如下： 

... -- • • • - - - * * - ^ 

class Board Node i 

friend int BB Arrangement (int * * ， int ， int，int * & ) i 
public: 

operator int ( ) const \ return (，山 1 


. ⑽ • 


private ： 

ini ^ v, // x[ 1 :n] id 录电路板排列 

S . // x [ J ： s ] 是当前结点所相应的部分排列 

d , // xLl:sj 的密度 

* now ; // now 、 j ] 足 x [ 1 : s ] 所含连接块 j 屮电路板数 

i ； 

• k 1 • • • • • 

函数 BBArmngememt 足解电路板排列问题的优先队列式分支限界法的主体。算法开始时， 
将排列树的根结点置为当前扩展结点。在初始扩展结点处还没有选定电路板，故= 0, 
wJ = 0, now [ i ] = 0,1 ^ i ^ R 数组 x 初始化为单位排列 r > 数纟 M total 初始化为 total [ i ] 等于 
连接块 i _ 所含电路板数 Aestd 表示当前最小密度， ksu 足相应的最优解。 

算法的 Awhile 循环完成对排列树内部结点的有序扩候。在 do - while 循环体内算法依次从 
活结点优先队列中取出具有最小 oJ 值的结点作为当前扩展结点，并加以扩展。如果当前扩展 
结点的 d > bestd ， 则优先队列中其余活结点都不可能妤致最优解，此时算法结束。 

算法将当前扩展结点分为两种情形处理。首先考虑 s = 〃 - I 的情形，此时 G 排定 n -1 块 
电路板，故当前扩展结点是排列树屮的一个叶结点的父结点^表示相应于该叶结点的电路板 
排列 J 十算出与 x 相应的密度并在必要时更新当前最优值 bestd 和相应的当前最优解 bestx , 

当 s < /I - 1时，算法依次产生当前扩展结点的所有儿子结点。对于 当前扩 展结点的每一 
个儿子结点 N ， 计算出其相应的密度 N . cd 。 当 N.d < he ^ td 时，将该儿子结点 N 插人到活结点 
优先队列中。而当 N . C d 身 bestd 时，以 N 为根的子树中不可能有比当前最优解 bestx 更好的解， 
故可将结点 N 舍去。 


int B B Arrangement (in t * * B ， int n, int m，int * & bestx) 

I // 解电路板排列问题的优先队列式分支限界法 

MinHeap < BoardNode > H(1000); // 活结点最小堆 
//初始化 

BoardNode E; 

E.x =： new int [n + 1 ]; 

E.s = 0; 

E-cd = 0; 

now = new int [m + 1J; 
int * total = new int [m 十 1]; 

// now[i] = x[ 1 :s] 所含连接块 i 中电路板数 
// total[i]= 连接块 i 中电路板数 

for (int i = 1; i < = m; i + + ) | 
totalLi 」=： 0; 

E.now[i] = 0; 

f 

for (int i=l;i<=n;i+ + )l 

£.x[i] = i ; // 初始排列为 12345...n 

for (int j = 1; j < = m; j + +) 

total[j] + = B[i] ： j ]； // 连接块 j 中电路板数 
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int be^td = m + 1; // 当的最 小密度 

ljeslx = 0; 

do : // 结点扩展 

ii'(E.s =；- n - I) ]// 仅一个儿于结点 
int Id = 0; // 最 ; ~n —块电路板的密度 

for (ini j = 1; j < = mi j 十十） 

Id + = BLE.x_nJ.LjJ ； 
if (Id < bestd) i // 密度更小的电路板排列 

delete [ ] bestx; 

bestx = E.x; 

l^sld = max(W ， E.cd); 

I 

\ 

else delete L] E.x; 
delete [ ] now; } 

el.e I// 产生 3 前扩展结点的所有儿子结点 

for (int i = E.s+l;i<=n ： i+ + )i 
Board IV ode IS ; 

N. now = new ini [川 + J !; 
for (int j = 1; j < = ni; j + + ) 

// 新插人的电路板 

N.now.j] = E.nowLj. + B|_E,x[i]][jj; 
int Id = 0; // 新插人电路板的密度 

for (int ) = 1 ； j < = m; j + + ) 

if (N ， now[_ j」> 0 & & tota][j] ! = N. now[j]) 

Id + +; 

U = max (Id, E.cd); 

if (N.cd < \^id) i// 可能 产生电 好的叶结点 

N , x = new ini [n + 1 ] j 

N.s = E.s + 1; 

for (int j = 1; j < - n; j + + ) 

N*x[j] = E^fj]; 

N‘x|_M.s] = E. x[i„; 

N.x[i] = E. x[ N. s.; 

H. Insiert( N); i 
els^e delete L J N.now; 1 
delete [ ] // 完成 A 前结点扩展 

try I H. Delete Min(E )； [ // 取下 一 扩展结点 

w 

catch (Out Of Bounds) i return bestd; i // 无扩展结点 
I while (E.cd < bestd); 

// 释放最小堆中所有结点 

do \ delete [ ] E_ x; 
delete [j E,now; 
try IH. DeleteMin( t) \ \ 
catch (…） ! break; | 



\ whJe ( true ); 
return b^std; 


6.9 批处理作业调度 

由 5.3 中关于批处理作业调度的回溯法分析可知，批处理作业调度问题的解空间树是一 
棵排列树。在作业凋度问题相应的排列空间树中，付-个结点瓦都对府于一个已安排的作业 
集於 ell，2, …，《丨。以该结点为根的子树屮所含叶结点的完成时间和可表示为： 

f : + Yfn 

设 imi = 『， a l 是以结点&为 ia 的子树¥的‘个叶结点，相应的作业调度为丨 ％， 
k = 1，2,…，艽屮，&是第 A 个安排的作业 c 如果从结点[开始到叶结点 L 的路上, ftf —个 
作业 w 在机器1上完成处理后都能立即在机器2卜_开始处珅.即从 心 +1 歼始，机器1没冇空闲 
时间，则对于该叶结点1有 

_ N 

X! ^2 ； = L F iPr ^ (n - k ^ ])t [pk + t 2 p k ] ^ ^1 

I ^ M i = ^ - 1 

如果不能做到 h 面这一点，则心只会增加，从而我们有 

类似地，如果从结点 E 开始到结点 i 的路上，从作业开始，机器2没有空闲时间，则 

a 

IX 彡 X [max(F 2 ,t\ + min t u ) + (n - k + 1 ) 名 2 ] : S 2 

M “ r 十 1 r r - W 

同理可知，^是的一个下界。由此，我们得到在结点处相应子树中叶结点完成时 
间和的下界是 € 

/ ^ / + maxi Si , S 2 \ 

其中，&与 S 2 的计算依赖于叶结点 L 相;、V :的作业调度= 1,2, … 注意到如果选择 
P 卜使 、在 k 》r + 1时依非减序排列，则 S, 取得极小值I。同理如果选择； n 使、依非减 

序排列，则 S 2 取得极小值》 2 。因此^ > S { , S 2 ^ 》 2 ,且 I 和》 2 与叶结点的调度无关。从而 
我们有 ^ 

/ ^ + maxi Si , 5 2 i 

这可以作为优先队列式分支限界法中界函数。 

算法屮用一个最小堆来表示活结点优先队列。最小堆中元素类型是 MinHeapNodeo 每一 
个 MinHeapNode 类塑的结点包含域 x， 用来表示结点所相应的作业调度^表示该结点已安排 
的作业是表示当前 Q 安排的作业在机器1上的最后完成 时间; 表示当前已安排的 
作业在机器2上的最后完成 时间; sf2 表示当前已安排的作、 Ik 在机器2上的完成时 间和; bb 表示当 
前完成时间和的下界。函数 Init 完成最小堆结点初 始化; 函数 NVwNode 产生最小堆新结点。 

• • • _ a • • • • • 

class Fiowshop ； 
class MinHeapNode I 
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friend Howshop ； 
public:; 

oj>erator int () const ) return bb; i 
private : 

void init(int ) ， 



NewNode( MinHeapNode ， int ， int ， int ， int); 


S ， 

// 已安排作业数 

fl , 

//机器1上最后完成时间 

f 2. 

//机器2上最后完成时间 

sf 2, 

//当前机器2匕的完成时间和 

bb , 

//当前完成时间和下界 

* x ; 

//当前作业调度 


void MinHeapNode ： : lmt(inL n) 

I // 最小堆结点初始化 

x = fi^vf ini [ n]; 

for (inti = 0; i < n; i + +) 

x[i] = i; 
s = 0; 
fl 0 ； 
f2 - 0; 

sf2 - 0 ； 

bb = 0 ； 


void MinHeapNode： : NewNode( MinHeapNode E,int Efl, 

int Ef2 y int Ebb,int n) 

f // 最小堆新结点 

x = new int [n ]; 
for (iut i n 0; i < n; i + + ) 
x[i] - E- x[i]; 

fi = m y 

a = Ef2 ； 

s f2 = E.sf2 + f2; 

bh = Ebb; 

S = F“ S + 1 ; 


在具体实现时，用一个二维数组 M 表示所给的 n 个作业在机器1和机器2所需的处理时 
间。在类 Flowshop 中用一个二维数组 b 存储排好序的作业处理时间。数组 a 表示数组 M 和 b 的 
对应关系 ^besk: 记录当前最小完成时间和， beslx 记录相应的当前最优解。函数 Sort 实现对各作 
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业在机器 1 和 2 t 所需时间排序。函数 Bound 用于计算完成时 N 和下界 


class Flywshop i 

friend void main( vokt); 
public: 

inL BBFlovf(void); 


n ， 


private : 

int Bouud( MinHeapNode,int & ,int & ,bool * * ); 
void Sort(void); 

// 作业数 

// 各作业所需的处理时间数组 
//各作业所需的处理时间排序数组 
//数组 M 和 b 的对应关系数组 
//最优解 
//最小完成时间和 

bool * * V ; //工作数组 


M ， 

b. 


* bestx, 
bestc ; 


void Fiowshop ： r Sort (void) 

I // 对各作业在机器 I 和 2 上所需时间排序 

int * c = new int [n]; 
for (int j = 0；j < 2;j + + ) 1 
far (int i = 0;i < n;i + + ) I 

b[i][j] = M[i][jJ; 

c[i] - i；i 

for (int i = Oji < n-l;i+ + ) 
for (int k - n - 1; k > i;k --) 

if (b[k][j] < b[k ^ l][j]) 1 
SwapCbfklCj], b[k- l][j ])； 

Swap(c[k], c[k - 1 ]); 1 
for (int i - 0;i < n;i + + ) a[c[i]][j] = i ； ] 
delete [ ] c ； 


int Flovvshop ： : Bound(MinHeapNode E.int & fl,int & f2,bool * * y) 

1 // 计算完成时间和下界 

for (int k = 0;k < n;k+ + ) 

for (int j r= 0;j < 2;j + +) 
y[k][j] = false; 

for (int k = 0;k < ^ E.s;k + +) 
for (int j = 0;j < 2;j + + ) 
y[a[E,x[kj][j]}Lj] = l 


• 194 ♦ 











fl = E.fl + MLE.x[E.s]][Ol; 

£2 = ((fl > E.f2)?fim) + M[E.xLE.sJJLl]; 

int sf2 = E.sf2 + f2 ； 

int si - 0,s2 - 0,kl - n - E► s, k2 = n - E.s, f3 = f2; 

// 计算 si 的值 

for (int j = 0;j < n;j + + ) 

if (lytjJLOj) I 

kl 

if (kl = = n ， E.s- 0 

O = (£2 > £1 + bLjJ[0j)?f2：fl + b[j][0]; 

si + = fl + kl ^b[j][0];> 

// 计算 s 2 的值 

for (int j - 0;j < n;j + + ) 

if(!y[j][l]) I 

k2 

si + = b[j][l]; 

s2 + = 0 + k2^b[j][l]j| 

// 返回完成时间和下界 

return sf2 + ((st > s2)?sl ： s2 )； 


函数 BBFlow 是解批处理作业调度问题的优先队列式分支限界法的主体。算法开始时，将 
排列树的根结点置为当前扩展结点。在初始扩展结点处还没有选定的作业，故 s = 0,数组 x 初 
始化为单位排列。 

算法的 while 循环完成对排列树内部结点的有序扩展。在 while 循环体内算法依次从活结 
点优先队列中取出具有最小 bb 值的结点作为当前扩展结点，并加以扩展。 

算法将当前扩展结点 E 分为两种情形处理。首先考虑 Ed = a 的情形，此时已排定〃个作 
业，故当前扩展结点 E 是排列树中的一个叶结点。 E . x 表示相应于该叶结点的作业调度 c E . sf 2 
是相应于该叶结点的完成时间和。当 E . S f 2 < bestc 时更新当前最优值 bestc 和相应的当 前最优 

解 bestx c 

当 E . 5 < «时，算法依次产生当前扩展结点 E 的所有儿子结点。对于当前扩展结点的每一 
个儿子结点 N ， 计算出其相应的完成时间和的下界 bb 。 当 bb < bestc 时，将该儿子结点 N 插人 
到活结点优先队列中。而当 bb 身 bestc 时，以 N 为根的子树中不可能有比当前最优解 bestx 更好 
的解，故将结点 N 舍去。 

解批处理作业调度问题的优先队列式分支限界法可描述 如下： 

▼ • • •• 产 - 户 ' --- - *• - % - .■.■•rraiakikik. - . ^ - -- i ^ k - ' - * •"" 

int Flowshop： : BBFlow (void) 

I // 解批处理作业调度问题的优先队列式分支限界法 
Sort(); // 对各作业在机器 1 和 2 上所需时间排序 
//定义最小堆的容量为 1000 

MinHeap < MinHeapNode > H(1000); 

MinHeapNode E ; 
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// 初始化 

E- Init(n); 

// 搜索排列空间树 

while (E.s < = n ) ) 

if ( E, s = = ti ) I // 叶结点 
if (E*sf2 < bestc) i 
bestc = E.sf2; 
for (int i = 0; i < n; i + + ) 
bestx[i] = E. x[L ; 1 
delete [ J E. x;! 

eise I // 产生当前扩展结点的儿子结点 
for (int i = E.s; i < n; i + + ) i 
Swap(E.x[E.s],E, xLi]); 
int fl ,f2 ； 

int bb = Bound(E,fl ,f2,y); 
if (bb < besto ) 1 

// 子树可能含最优解 
// 结点插入最小堆 
MinHeapNode N; 
N.NewNode(E.fl,£2»bb,n); 

H.Ins< ； rt( N); i 

Swap(E.xl_E.aJ ,E.x[i]); 

! 

I 

delete [ ] E. x; r // 完成结点扩展 
try |H.DeleteMm(E);i // 取下 _ *扩展结点 

catch ( OutOfBounds) I break; I // 堆已空 

I 

return beatc; 


习题 6 

6-1 栈式分支限界法将活结点表以后进先出 （ UFO ) 的方式存 储于- ♦个栈中。试设计一 
个解 0-1 背包问题的栈式分支限界法，并说明栈式分支限界法与回溯法的区别。 

6-2 修改解装载问题的分支限界算法 MaxLoading , 使得算法在结朿前释放所有已由 
En Queue 产生的结点。 

6-3 解装载问题的分支限界算法中，由 EnQueue 产生的结点吋以在算法结束前一次性 
删除 c 然而那些没有活儿子结点或没有叶结点的扩展结点可以立即被删除。试设计一个在算法 
中及时删除不用结点的方案，并讨论其时间与空间之间的折衷。 

6-4 试修改解装载问题和解 0 M 背包问题的优先队列式分支限界法，使其仅使用一个最 
大堆来存储活结点，而不必存储所产生的解空间树。 
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6-5 试修改解装载 M 题和解 <)-1 背包问题的优先队列式分支限界法，使得总法在运行结 
束时释放所有类型为 blincxle 和 HeapNude 的结点所占用的空间： 

6-6 在解最大团问题的优先队列式分支限界法屮，3甜扩展结点满足⑼ + n - z > fetn 
的右儿子结点被插人到优先队列屮如果将这个条件修改为满足 w + a - 〖> beshW 『儿子结 
点插人优先队列，仍能保证算 法的正 确性吗?为什么？ 

6-7 考虑最大团问题 的子集 空 W 树中第/层的一个结点 t 设 MinDcgrM ^) 是以结点 
^为根的子树中所有结点度数的最小值。 

(1) 设又* w = mini x .cn + u - + 1 ， MinDegr<^e( x) -¥ \ ^ ，证明以结点 ,t 为根的子树中任 

一叶结点所相应的团的大小不超过1 u 。 

(2) 依此^ ^的定义重写算法 BBMaxCHque , 

(3) 比较新旧算法所需的计算时问和产生的排列树结点数。 

6-8 试修改解旅行售货员问题的分支限界法，使得 h ^ _ 2的结点不插入优先队列，而 
是将当前最优排列存储于 b es t P 屮.经这样修改算法在下-个扩膊结点满足条件 Lco,t ^ 
be ^ tc 时结柬。 

6-9 试修改解旅行售货员问题的分支限界法,使得算法保存已产生的排列树 u 
6-10 试设计解电路板排列问题的队列式分支限界法，并使算法在运行结朵时输出最优 
解和最 优值。 

6-11 试设计-个解最小长度电路扳排列问题(见习题 5-9) 的队列式分支限界法。 

6-12 用优先队列式分支限界法解最小艮度电路板排列 问题。 

6-13 试设汁一个解图的顶点覆盖问题的优先队列式分 i ； 限界法„ 

6-14 试设计一个解图的最大割点问题的优先队列式分支限界法： 

6-15 试设计一个解最小重量机器设计问题(习题 5-10) 的优先队列式分支限界法： 

6-16 试设计一个解运动员最佳配对问题 (> j 题 5-14) 的优先队列式分义限界法。 

6-17 试设计-个解网络设汁问题(习题 5-20) 的优先队列式分支限界法 .:， 

6-18 试设计-个解 n 后问题的优先队列式分支限界法。 

6^19试设计一个解圆排列问题的优先队列式分支限界法。 

6-20 试设计一个解布线问题 (习题 5-25) 的优先队列式分支限界法。 

6-21 试设计-•个解最佳调度问题(习题 5-26) 的优先队列式分支限界法。 

6-22 试设汁一个解无优先级运 算问题 ( Y 题 5-27) 的优先队列式分支限界法 
6-23 试设计一个解最大 A 乘积问题（习题5 -28) 的优先队列式分支限界法。 

6-24 试设计一个解世界名画陈列馆 H 题(习题 5-29) 的优先队列式分支限界法。 

6-25 用队列式分支限界法重做习题 5- . 

636用队列式分支限界法1做习题 5- 12。 

6-27 用队列式分支限界法重做习题 5- 13。 

6-28 用优先队列式分支限界法重做习题5 - 11。 

6^29用优先队列式分支限界法重做习题 5-1 L 
6-30 用优先队列式分支限界法東 做习题 5- ?3。 
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第 7 章概率算法 


学习要点 

- 理解产生伪随机数的算法 

• 掌握数值概率算法的设计思想 

■ 掌握蒙特卡罗算法的设计思想 

‘掌握拉斯维加斯算法的设计思想 

• 掌握舍伍德算法的设计思想 

前面各章中所讨论算法的每一计算步骤都是确定的，而本章所讨论的概率算法允许算法 
在执行过程中随机地选择下一个计算步骤。在许多情况下，当算法在执行过程中面临一个选 
择时，随机性选择常比最优选择省时。因此概率算法可在很大程度上降低算法的复 
杂度。 

概率算法的一个基本特征是对所求解问题的同-实例用同一概率算法求解两次叮能得到 
完全不同的效果。这两次求解所需的时间甚至所得到的结果吋能会有相当大的差別。一般情 
况下，可将概率算法大致分为 四类: 数值概率算法、蒙特卡罗 （Monte Carlo ) 算法、拉斯维加斯 
(Las Vegas ) 算法和舍伍德 ( Sherwut ) d ) 算法。 

数值概率算法常用于数值问题的求解。这类算法所得到的往往是近似解。 a 近似解的精 
度随计算时间的增加而不断提高。在许多情况下，要计算出问题的精确解是不可能的或没有 
必要的，因此用数值概率算法可得到相当满意的解。 

蒙 特长罗 方法用于求问题的准确解。对于许多问题来说，近似解毫无意义。例如，一个判 
定问题其解为“是”或“否'二者必居其一，不存在任何近似解答。又如，我们要求一个整数的 
因子时所给出的解答必须是准确的 ，一 个整数的近似因子没有任何意义。用蒙特卡罗算法能 
求得问题的一个解，但这个解未必是正确的。求得正确解的概率依赖于算法所用的时间。算 
法所用的时间越多，得到正确解的概率就越高。蒙特•罗算法的主要缺点也在于此。一般情 
况下，无法有效地判定所得到的解是否肯定正确。 

拉斯维加斯算法不会得到不正确的解。一旦用拉斯维加斯算法找到一个解，这个解就一 
定是正确解。但有时用拉斯维加斯算法会找不到解。与蒙特卡罗算法类似，拉斯维加斯算法 
找到正确解的概率随着它所用的计算时间的增加而提高。对于所求解问题的任一实例，用同 
一拉斯维加斯算法反复对该实例求解足够多次，可使求解失效的概率任意小。 

舍伍德算法总能求得问题的一个解，且所求得的解总是正确的。当一个确定性算法在最 
坏情况下的计算复杂性号其在平均情况下的计算复杂性有较大差别时，可在这个确定性算法 
中引人随机性将它改造成一个舍伍德算法，消除或减少问题的好坏实例间的这种差别。舍伍 
德算法精髓不是避免算法的最坏情况行为，而是设法消除这种最坏情形行为与特定实例之间 
的关联性。 

在本章的后续各节中将分别讨论 h 述4类概韦算法。 
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7.1 随机数 

随机数在概宇算法设计中扮演着十分_$:要的角色。在现实计算机 h 九法产生真止的随机 
数，因此在概率算法中使用的随机数都是…定程度上随机的，即伪随机数。 

产生伪随机数最常用的方法是线件同余法。由线性间余法产生的随机序列 ah « 2 ，…， 
，…满足 

{ do = d 

a rf = ( ba n i + c ) mod m = 1 ， 2 ， •" 

其中，6会()，^0, 称为该随机序列的 种了。 如何选取该 力法中 的常数•和 m 

直接关系到所产生的随机序列的随机性能。这是随机件理论研究的内桴，已起出小书讨论的 
范围。从自:观上看， m 应取得充分大，因此町取 W 为机器大数65 536,另外应取 
gcd ( m , A ) = 1，因此可取6为一索数。 

为了在设计概率算法时便于产生所需的随机数，建立•个随机数类该 
类包含一个需由用户初始化的种子 rand Seed 0 给定初姶种子后，即吋产生与之相应的随机序 
列。种子 ranrlSeed 是一个无符号氏整型数，可由用户选定也可用系统时间自动产生。函数 
Random 的输人参数 n ^65 536是_个无符号长整型数，它返回0 〜 (ji - 1) 范围内的一个随机 

整数 。 函数 mandom 返回[0,丨）内的一个随机实数。 

• • • • • • • • • 

//随机数类 

const unsigned long maxshoil = 65536L; 
consl unsigned lon^ multiplier = 1194211693L; 
const unsigned Jong adder - 12345L; 

class Random Number 

I 

I 

I 

private ： 

// 当前种子 

unsigned Jong randSeed; 
public: 

V 构造函数，缺省值 0 表示由系统自动产生种 -p 

Random Number (unsigned long s = 0 )； 

// 产生之间的随机整数 

unsigned short Randum(imsigntxl long n); 

// 产生 [0,1) 之间的随机实数 

double fRandom(void); 

I ； 

函数 Rambm 在每次计算时，用线性同余式计算新的种子 randSeed : 它的高16位的随机 
性较好.将 mMSeedA 移16位得到…个0 〜 65 535 N 的随机整数，然后 再将此 随机整数映射 
MO-(n - 1) 范围内。 

对于函数 fKandom ，我们先用函数 Random ( maxshurl ) 产生 一 个0 〜 （maxshort - 1) 之间的 
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整型随机序列，将每个整 M 随机数除以 maxshort ， 就得到[0，1) 区间 中的随机实数 

// 产生种 + 

RandomNumber： : RandomNiimlwr (long s) 

I 

I 

I 

if (s = = 0) 

randSmi = time(0); // 用系统时间产生种子 

else 

randSeed = s; // 由用户提供种子 

I 

// 产生 0:n -] 之间的随机整数 

unsigned short RandomNurober :: Random (unsigned long n) 

I 

randSeed = multiplier * randSeed + adder; 
return (unsigned short) ((randSeed > > 16) % n); 


// 产生 [0,1 ) 之间的随机实数 

double RandomNumber: : fRandom (void) 

I 

1 

return Ratwlom( maxshort)/double(maxshort); 


下面用计算机产生的伪随机数来模拟抛硬币试验。假设拋10次硬币，每次抛硬币得到正 
面和反面是随机的。拋10次硬币构成一个事件。函数调用 Ramlom (2) 返回一个二值结果。 
返回0表示拋硬币得到反面，返回1表示得到正面。下面的函数 T oss Coi ns 模拟抛10次硬币 
这一事件。在主程序中反复用函数 TussCoins 模拟拋10次硬币这一事件50 000次。用 
}1從(1[〖](0$^10)记录这50 000次模拟恰好得到 I •次正面的次数。主程序最终输出模拟抛 
硬币事件得到正面事件的频率图，如图 7-1 所示。 

int TossCoins(int numberCoins) 

! // 随机抛硬币 

siatic RandomNumber coinToss; 

int i，tosses = 0; 

for (i - 0 ji < numberCoins ； i+ + ) 

// Random(2) = 1 表不正面 
tosses + - coinToss- Random(2); 
return tosses; 


void main(void) 

i // 模拟随机抛硬币事件 
const int NCOINS = 10; 
const long NTOSSES = 50000L; 
// heads[i] 是得到 i 次卍面 的次数 
long i, heads[NCOINS + l]; 
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itil j ， position; 

// 初始 化数组 heads 

for (j = 0;j < NCOTNS+ l;j+ +) 
heads. jJ =0; 

// SW 50,000 次模拟事件 

fW (i = 0ii < NmsS£S ； i+ + ) 

h«ads_ TossCoinK( NCOINS) ] + + ; 

// 输出频率图 

for (i = 0; i < = NC01NS ； i+ + ) 

I 

position = int(float(hcatisLi])/NTOS5ES *■ 72〉; 
cout < < setw(6) < < i < < ,f ”; 
for (j = 0; j < position - l;j+ + ) 
cout < < ,f ff ; 
cout < < " 头 , '< < cndi; 


0 ^ 

1 * 

2 * 

3 * 

4 * 

5 

6 ^ 

參 

7 * 

8 * 

9 - H - 

10 ^ 

图 71 模拟抛硬币得到的正面事件频串图 

7.2 数值概率算法 


7.2.1 用随机投点法计算 7T 值 


设有一半径为 r 的圆及其外切四边形，如图 7-2U) 所不。向该正方形随机地投掷 n 个 
点。设落人圆内的点数为 L 由于所投人的点在正方形上均匀分布，因而所投人的点落人圆 

内的概率为 g = f ;所以当^1足够大时 J 与 n 之比就逼近这一概率，即从而。 

由此可得用随机投点法计算 r 值的数值概率算法。在具体实现时，只要在第-象限 il 算即可， 
如图 7-2(b) 所示。 
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7.2.2 计算 定积分 

( I ) 用随机投 A 法计算定积分 

设 / U > £[0 J ] t - 的连抹 Hitt •!!()(/ u > 笔 I •需《汁 nm 分值，： l /( x ) dicm 5> 
/等于图 7-3 中的面积 Cc 
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0 
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ffl 7-2 什籌|»«的 III 7-3 HU 定积分 

_机找 点法 的 I ■机投 点技 

仗 ffi 7-3 所示单位 iE 方形内均匀地作投 点试翰 .則 HI 机* *4 曲线 r 


幸为 


/ U > 下面的砜 


尸 r I ，笔 /U ) I 


: rr 


dyti 


/(i)d 


u 


«设向牢位 £* 彤内«机地投人 n 个点 （ x .' lU * 1,“.，1»。«机点(~,>^)落人6内. 
Wr •条 / U > . 如 粜有的 个点落入 G 内.则/ r 芒近似等1«机点落人 c 内 的蟖率 •脚 


由此可设 计出计 籌枳分/的败侑锇率算法 
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、“V 
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用》机«点法计算 定枳分 
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int k= ： 0; 

for (ini i = 1 ;i < = ri; i + + ) i 
double x = dart. fKarnlom(); 
double v = dart. rKandom() \ 

if U < = r ( x )) k + + ； 

r 

l 

I 

return k/Jouble(u); 


如果所遇到的积分形式为 / = |/U)dL 其屮，和&为有 限值; 被枳函数 /U) 在区间 

a 

[a, 6] 中有界，并用対， L 分别表不其最大值和最小值。此时可作变量代涣.V - a ;( b - a ) z . 
将所求积分变为/ = €厂 + L 其中， 


c = (M - Ij){b - a ) ^ d = L{h - a ) ^ I ^ - jf A ( z ) i\z 

o 

/ ( z ) = M - + — L ] (0 备广 （ z ) 矣 1) 

因此 ，广 可用随机投点法计算。 

( 2 ) 用平均值法计算定积分 

仟取一组相互独立、同分布的随机变量 I ?丄 f , 在 [ a , 6 ] 中服从分布律 / U ) ,令， U ) = 

-—： ，则 U \ 丨也是一组互相独立、同分布的随机变量，而且 
/ U ) 

b b 

£(〆 ($))= g * ( x ) f ( = j ^(, v ) d ^ = / 

%* ^ 

由强大数定理 ° ^ 

P r ( lim + ⑹ = 4 = 1 

W 71 t 、】 / 

若选 7 = 丄则 7 依概率 I 收敛于平均值法就是用/作为/的近似值。 

n iz：l 

b 

假设要计算的积分形式为/ = gU ) d ^， 其中被积函数纟 U ) 在区间[«彳]内吋积。 

v 

任意选择一个有简便方法可以进行 fi 样的概率密度函数 / U )， 使其满足下列 条件： 

① f ( x ) #0，当 g { x ) #0时 X 名 6); 

h 

② \ f ( x)dx ^ l c . 


如果记 


[gill 

g* (文）= | /( ^) 


fix ) ^ 0 

/( 尤 ） = 0 


则所求积分可以写为 
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/ = g U /( -t )ci 

鬌 

o 

由于 《 和 6 为办限位，可取 fix) 为均匀 分布： 


X 



这时所求积分变为 


f 二 （b - a) g(x) ^ 一 d 义 

J I ) 一 d 


在 [ a ， M 区间 h 随机抽取个点 =丨， 2 ,…， 71 ), 则均值7 = 可作为所 

71 r = l 

求积分/的近似值。 

由此可设计出汁算积分/的平均值& 如下： 

double Integration(Jouble a, double b. int n) 

'" 用平均值法计算定积分 

static Random Number rnd; 
double y = Oj 

for (iiH i=l;i< = n;i+ + ) 毛 

double x - (b - a) * md.fRandom() + a; 
y + = g(x); 

i 

return (b - a) ^ y/double( n); 


7.2.3 解非线性方程组 

假设我们要求解下面的非线性方程组 

fi(x ] ，欠 2 ,…， ：o = 0 

,2(;^，％ 2 ,…，、 ） = 0 
4 

I • » 

f n ( xi ， x 2 r ^ jX n ) = 0 

其中， A ， h ， …，、是实变量，力 U = I ， 2 ,…，幻是未知量 A ， h ， …，、的非线性实函数。我 

们要求上述方程组在指定求根范围内的一组解 W ，… ，“。 

解决这类问题有许多种数值方法。最常用的有线性化方法和求涵数极小值方法。应当指 
出，在使用某种具体算法求解的过程中，有时会遇到一些麻烦，其至于使方法失效而不能获得 
一个近似解。在这种情况下，我们可以求助于概率算法•一般而概率算法需耗费较多时间， 
但其设计思想简单，易 f 实现，因此在实阽使用中还是比较有 效的。 对于精度要求较高的问题， 
概率算法常常可以提供一个较好的初值。下面介绍求解非线性方程组的概率算法的基本思想。 
为了求解所给的非线性方程组，构造一 H 标函数 

^( x ) = V ] 
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其中，: e = •，: t 丄由最优化埋论町知，该目标函数 0(. t ) 的极小值点即足所求非线 

性方程组的一组解。 

在求函数 ^( x ) 的极小值点时可采用简单随机模拟算法。在指定求根区域内，选定一个 
&作为根的初值。按照预先选定的分布（如以&为中心的正态分布，均匀分布，上角分布等）， 
逐个选取随机点％计算0标函数少 U )， 并把满足精度要求的随机点 x 作为所求非线性方程 
组的近似解。这种方法直观、简单 ， 但工作量较大。下面介绍的随机搜索箅法叶以克服这一 
缺点。 

在指定求根区域内，选定一个随机点^作为随机搜索的出发点。在搜索过程中，假设第 
j 步随机搜索得到的随机搜索点为在第 y + 1步，首先计算出下一步的随机搜索方向 r ; 然 
后汁算搜索步长〜由此得到第 y + 1步的随机搜索增量:从当前点 '依随机搜索增 
得到第）+ i 步的随机搜索点；=巧 + △巧。当 < Hx < e 时，取: ^ + 1 为所求非线性方程 
组的近似解。否则进行下 • 〜步新的随机搜索过程。 

具体算法可描述 如下： 

bool Non Linear! double * ^0, double * dxO, double * x, double aO ， 

double epsilon, double k, int n，int Steps, int M) 

i // 解非线性方程组的概率箅法 

static RandomNumber rnd; 

bool success; // 搜索成功标志 

double * dx, * r; 

dx = new double Ln + 1J; // 步进增量向量 

r = new doubW [n + 1 ]; // 搜索方向向量 

int mm = 0; // 当前搜索失败次数 

int j = 0 ； // 迭代次数 

double a - aO; // 步长因子 
for (int i = i;i < - n;i + +) I 
x[i] = xO[i ]； 
dx[i] = dx0[i]; 

1 

double fx = f(x ， n); // 汁算目标函数值 

double min = fx; // 当前最优值 

while ((min > epsilon) & & (j < Steps)) f 

//(l ) 汁算随机搜索步长 
if (fx < min) i // 搜索成功 

min - fx; 
a * - k; 
smce9s =： true ； I 

eke i // 搜索失败 

mm + 十； 

if (mm > M) a/ = k; 
success ; false;« 

// (2 ) 沽算随机搜索方向和增量 

for (int i l；i < = nn + + ) 

r[ij = 2.0 * rml. fRandom( ) - 1; 
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if (success) 

for ( int i = 1; i < = n; i + + ) 
dx ： il = a * rLi. i 

eLse 

for (int i = 1 ;i < = n;i + + ) 
dx[i] = a * Yii\ - Jx[i]; 

// ⑶ H •算随机搜索点 

for (int i = 1 ; i < = 11;i + 十） 
x|_ij + = dx[i] i 

// (4) 汁算 Ste 函数值 

fx - f(x*n); 

I 

I 

if (fx < = epsilon) return true; 
else relurn ffilsc; 


7.3 舍伍德 ( Sherwood ) 算法 

我们分析一个算法在平均情况下的计算复杂性时，通常假定算法的输人数据服从某一特 
定的概率分布。例如，在输入数据是均匀分布时，快速排序算法所需的平均时间是 0 (n logn), 
Ifif 当其输入已 “ 几乎 ” 排好序时，这个时间界就不再成立。此时，町采用舍伍德算法消除算法所 
需计算时间与输入实例间的这种联系。 

设 A 是一个确定性算法，当它的输人实例为％时所需的计算时间记为 u(x) 。 设；^ 是算 
法 A 的输入规模为《的实例的全体，则当问题的输入规模为 n 时，算法 A 所需的平均时间为 

飞 » : 2 u(x)/ I X n j 

W x n 

这显然不能排除存在 X 6 使得 > t A (n) 的可能性。我们希望获得一个概率算 
法 B, 使得对问题的输入规模为 n 的每 - 个实例 x G 夂均有 r B (.r) = / A U) + 对于某 
一具体实例 x 6 X n ，算法 B 偶尔需要较 “ （幻 + s(n) 多的计算时间。但这仅仅是由于算法所 
作的概率选择引起的， 4 具体实例 x 无关。我们定义算法 B 关于规模为 n 的随机实例的平均时 
间为 


^b(^) = 2 H(x)/{ X n ) 

易知化 U ) = q (幻 + sU )。 这就是舍伍德算法设计的基本思想。当 «) VqU ) 相比 
可忽略时，舍伍德算法可获得很好的平均件能。 

7.3.1 线性时间选择算法 

在第 2 章中我们讨论了快速排序算法和线性时间选择算法。这两个算法的随机化版本就 
是舍伍德型概率算法。这两个算法的核心都在于选择合适的划分基准。对于选择问题而言，用 
拟中位数作为划分基准可以保证在最坏情况下用线性时间完成选择 t ，如果只简单地用待划分 
数组的第一个元素作为划分基准，则算法的平均性能较好，而在最坏情况下需要 0(n 2 ) 计算 
时间。 舍伍德型选择算法则随机地选择--个数组元素作为划分基准这样既能保证算法的线性 
. 206 ， 



时间平均性能乂避免 f 计算拟中位数的麻烦。 

非递! U 的舍伍德型选择算法可描述 如卜： 

template < class Type > 

Tjpe select( Type a[ J , int \ y int r. in{ k) 
i// 计算 aLlrrj 中第 k 小元荼 

static H a ado mN limber rnd; 
while (Irue) i 
if (1 > = r) return aLl 」； 
int 丨 = 1 ， 

j = 1 + md. Random(r - 1 + 1); // 随机选择的划分基准 
Swap(a[i] % ii.jj); 



Type pivol = a.l]; 

// 以則分基准为轴作元素交换 

whil^(lrue) i 

while (a[ + + i」< pivot); 
while (a[ —— j] > pivot) : 
if (i > = j) break; 

Swap(a[i] ， a[j]); 

I 

I 

I 

if (j - 1 + 1 = = k) return pivot; 
aLlJ = a[}] j 
a[j] - pivot; 

// 对+数组重复划分过程 

if (j 一 1 十 1 < k> ! 

k = k - j + 1 - 1; 



else r = j 一 


template < class Type > 

Type Select(Type , int ini k ) 

i // H 算 aL 0 :n - 1] 中第 k 小元素 
// 假设 aLri」 是一个键值无势大的元素 

if (k < 1 I I k > n) throw OutOfBounds(); 
return select(a ， 0， n- 1, k); 


由于算法 select 使用了一个随机数产生器随机地产生 / 和 r 之间的一 t 随机整数，因此， 
算法 select 所产生的划分基准是随机的。可以证明，当用算法 select 对含有 n 个元素的数组进行 
划分时，划分出的低区子数组中含有一个元素的概率为 2/ n ; 含有；个元素的概率为 \/ n y 
i = 2,3, - 1。今设 7 U ) 是算法 select 作用于一个含有^个元素的输人数组上所需的期 
望时间的一个上界，且 Tin ) 是单调递增的。在最坏情况下，第 A 小元素总是被划分在较大的 
子数组中。由此，我们可以得到关于 T ( n ) 的递归式： 
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7 ( /t) 在丄 ( 7 1 ( max (1, " - 1) ) + T( max ( t, /t - /))) + 0(n) 

11 L: l 

-I 77 z ^ 

^ —( 7^( - 1) + 2 y] r( o) + (){n) 

71 c/2 

= 7 V ； 7^(0 + 0(n) 

在 h 面的推导中，从第丨行到第 2 行 是因为 max ( l ，《.-〗）= « - 1，而 


max( t— i ) 



i ^ n /2 
i < n /2 


fl n 足奇数时， rU/2). rU/2 + 1)， …， r(n ~ 1) 在和式中均出现 2 次; /i 足偶数时， T ( n /2 
+ i ), T ( n /2 + 2 ) r -. T(n - I)均出观2次， T ( n / 2 ) 只 (ll 观1次。因此，第2行中的和式是第 
1行中和式的一个上界。从第2行到第3行是因为在最坏情况下 T(n - 0 = 0(^)，故可将 
T(n - \)/ n 包含在 0U) 项中。 

解上面的递归式可得 7 T U) = 0U)。 换句话说，北递归的舍伍德型选择算法 W ⑽吋以 
在 0(n) 平均时间内找出^个输入元素屮的第 it 小元素。 

综上所述，我们开始时所考虑的是一个有很好平均性能的选择算法，但在最坏情况下对某 
些实例算法效率较低。在这种情况下，我们采 用概率 方法，将 h 述算法改造成一个舍伍德型算 
法，使得该算法以高概率对任何实例均有效。对于舍伍徳型快速排序算法，分析是类似的。 

上述舍伍德型选择算法对确定性选择算法所作的修改非常简单且容易实现。但有吋所给 
的确定性算法无法飪接改造成舍伍德型算法。此时可借助于随机预处理技术，不改变原有的确 
定性算法，仅对其输入进行随机洗牌，同样吋收到舍伍德算法的效果。例如，对于确定性选择算 
法,我们可以用下面的洗牌算法 Shuffle 将数组 a 屮元素随机排列，然后用确定性选择算法求 
解^这样做所收到的效果与舍伍 德划算 法的效果是一样的。 


template < class Type > 
void Shuffle(Type a[ ], int n) 

;// 随机洗牌算法 

static Random Number rrnt; 
for (int i = 0；i < ti;i + + > 《 
int j = rnd . Hnndonjii ] - i) + i; 
Swap(a|_i], u ■: jj); 


7,3.2 搜索有序表 

有序字典是表示有序集很有用的抽象数据类型。它支持对有序集的搜索、插人、删除、前 
驱、后继等运算。有许多基本数据结构可用于实现有序字典。下面我们讨论其中的一种基本数 
据结构。 

我们用两个数组来表示所给的含有〃个元素的有序集&用 value[0^] 存储有序集中的元 
素， link[0：n] 存储表示元素 在数组 value 中位置的指针 Jink[0] 指向有序集屮第1个元素。换句话 
说， val Ue [link[0]] 是集合中的最小元素:一般地，如果 value[^] 是所给有序集 S 中的第 A 个元素， 
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则 V di « Oink [ i ]] 是 S 屮的笫十1个元 U 中元 素的有 序性表现为，对于任, Si 名 i 
value [ i ] ^ value [ link [ /]]。集合5中的最大元素 valued k ] 有， link [众 〕= ()fl value _0] 是 一 个大数 n 
例如，表¥有序集 S = 11,2,3,5,8,13,211的一种表示釭式如图 7-4 所示。 

—■ ■ ■■ ■ ■ — ^―^― ■ • ， ••麵 ％— • • W 

i 0 1 2 3 4 5 6 7 

value[ i "! 龙 2 3131 5 21 8 

iV _ 〔 2 — 5 6 1 7 0 3 

" W 7^4" I 数组表示有序集 

在此例中， link [0] = 4指向 S 中最小元素 value [4] = U ® 而易见，这种表示有序集的力 
法实际上是用数组来模拟有序链表/对于有序链表，町采用顺序搜索的方式在所给的有字集 S 
中搜索链值为 x 的元素。如果有序隽 S 中含有 a 个元素，则在最坏情况下，顺序搜索算法所霈 
的计算时间为 0 ( n) c 

利用数组下标的索引性质，我们可以设计一个随机化的搜索算法，以改进算法的搜索时间 
复杂性。算法的基本思想是随机抽取数组元素若干次，从较接近搜索元素 x 的位置开始作顺序 
搜索。可以证明，如果随机抽取数组元素次，则其后顺序搜索所需的平均比较次数为 
0 ( n/(k + 1))。因此如果取 = L /^」， 则算法所需的平均计算时间为 0 W ' n) c 

下面讨论上述算法的实现细节。用数组来表示的有序链表由类 OrderedList 定义 如下： 


template < ckss Type > 
cla^s OrdemILiyt i 


public : 

Ord<iredList( Type small, Type Laige, int MaxL); 
〜 OrderedList(); 


bool Search (Type x ， int& index); // 搜索指定元素 


int Searchl.ast{ void); 
void Inaert(Tvpe k); 
void Delete 1 ' Type k); 
void Output (); 
private ： 


int ii; 


// 

int MaxLength; 

// 

Type 

^ value; 

// 

int * 

link; 

// 


// 搜索最大元素 
// 插人指定元素 
//删除指定元素 
//输出集合中元素 

当前集合中元衮个数 
集合中最大兀素个数 
存储集合中元素的数组 
指 封数组 


RandomNuml>er mil; // 随机数产生器 


Type Small; //集合中元素的下界 

Type TuilKeyi //集合中元素的上界 


template < class Type > 

Ordered last < Type > :: OrderiidljstC T ype small t Tvp^ Large, int Maxi.) 

i // 构造函数 

MaxLengtK - MaxL; 

value = new Type [ Max Length +1 」； 

link r ： new int L Max Length + 1 _; 

TailKey = Large; 
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n 4 = 0 ; 
link[ 0 j = 0 ; 
value[0j = TailKey ； 
Sma]l ^ small; 


template < class Type > 

OrderedList < Type > Ordered Lis t() 

i // 析构函数 

delete value; 
delete link; 

f 

• 讎 • • • • • 

... • . * * ■ 

其中， MaxLength 是集合中元素个数的上限; Small 和 TailKey 分别是全集合中元素的下界和上 
界; OrderedList 的构造函数初始化其私有成员数组 value 和 link , 它的析构函数则释放 value 和 

link 占用的所有空间。 一 

OrderedList 类的共享成员函数 Search 用來搜索当前集合中的元素“当 Search 搜索到元 

素 J 时，将该元素在数组 value 中的位置返回到 index 中，并返冋 true ， 否则返回 fake 。 

, ■ ■ SV 馨鑛馨着 w • 馨 

r m m f ■參 a _參_籲 修峰髒 籲,參 * 

template < class Type > 

boo] OrderedList < Type > :: Seari h(Type x T int& index) 

i" 搜索集合中指定元素 k 

index = 0; 

Type max - Small; 

int m = floor( Sqrt (double( n ))) ;// 随机抽取数组元素次数 
for (int i= l;i<^ m;i+ + ) I 
int } = rnd.Random(n) + i; // 随机产生数组元素位置 
Type y = valuefj]; 
if ((max < y) & & (y < x)) I 
max = y ； 
index = j; ? 

I 

// 顺序搜索 

while (Yalue[bnkL index j ] < x) index =： link [index]; 
return (value[link[index]] - ^ x); 


有了函数 Search , 就容易设计支持集合的插人和删除运算的算法 Insert 和 Delete 如下。插 
入运算首先用函数 Search 确认待插人元素不在当前集合中，然后将新插土的元素存储在 
value [« -f 1] 中，并修改相应的指针 。 Insert 所需的平均计算时间显然为 0( V ~ n) o 


template < class Type > 

void OrderedList < Tvpe > : : Insert (Type 


I // 插人指定元素 



if ((n = = MaxLength) M (k > = TailKey)) return ； 
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int index; 

^ ( !Soarch(k, index)) | 
vaW[ + + n 」 - k; 
linkfn] = linkL index] \ 
liiikf index] = n;: 
f 

• • • • • 

删除运算旨先用函数 Search 找到待删除 元素& 在当前集合中的位置，然后修改待删除元 
素4的前驱元素的 link 指针，使其指 A 待删除兀素&的后继元素。被删除元素&在有序表中产 
生的空洞，由当前集合中的最大冗素来填补。搜索当前集合中的最大兀素的任务由函数 
SearchLast 来完成。与函数 Search 类似，函数 Search Last 所需的平均计算时间也是0(/^〉。因 
此，实现删除运算的算法 Delete 所需的平均计算时间为 

'* ' . • . . r - - . 

template < class Type > 

int OrderedList < Type > : i Search Last (void) 
l // 搜索集合中最大元素 

int index = 0; 

Type x = valueLii 」； 

Type max = Small; 

ini in = floor(sqrt(double( n))) ； // 随机抽取数组元素次数 

for (int i - I; i < = m ； i + + )) 

int j = rnd.Random(u) + 1 ; // 随机产生数组元素位置 

Typey =： valueL j j 5 
if ((max < y) &d r (y < x)) I 
max = y; 
index = j; i 

I 

? 

// 顺序搜索 

while (link[ index 1! = n) index = link[ index]; 
return index ； 


template < ckss Type > 

void OrderedList < Type > :: Ddete(Type k) 

i // 删除集合中指定元索 k ' 

if ((n = = 0) I I (k. > = TailKey)) return; 
int index; 

if (Sear<.:h( k, index) ) j 
ini p = link [ 彳 ndex 」； 
if (p = - n) linkLindex] = link[p]; 
else I 

if (link[p]! ~ ti) I 
int q = SearchLastf ); 

linkL q 」 = p; 

litikLindex 」 =link[p]; | 
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valuej p 」 =valuerr】]; 

liuk^p, = Jink[n]; 



7.3.3 跳跃表 

舍伍德 ® 算法的设计思想还可用于设计高效的数据结构，跳跃表就是一例。我们知道，如 
果用有序链表表示一个含有《个元素的有序集则在最坏情况下，搜索 S 中一个元素需要 
0( 幻计算时间。提高有序链表效率的一个技巧是在有序链表的部分结点处增设附加指针以 
提高其搜索性能。在增设附加指针的有序链表中搜索一个元素时，4借助于附加指针跳过链表 
中若千结点，加快搜索速度。这种增加了向前附加指针的有序链表称为跳跃表。应在跳跃表的 
哪些结点增加附加指针以及在该结点处应增加多少指针完金采用随机 化方法 來确定。这使得 
跳跃表可在 o(lagfz) 平均时间内支持关于有序集的搜索、插人和删除等运算。例如，图 7-5U) 
是一个没有附加指针的有序链表，而图 15(b) 在图 7-5U) 的基础上增加了跳跃一个结点的附 
加指针，图 74(c) 在图 7-5(b) 的基础上又增加了跳跃3个结点的附加指针 u 


Op - W^l 

■ ill* 



1 J 2 


iir^Hi3| 4-H 

Ca) 


3 


— *4 


5 


- - 


n 


13 


纖 






23 



( b ) 






_■ > 




一 


H 

X 

— 


— 

—J | 7 



BihbIBe 



L 


(c) 


图 7-5 完全跳跃表 

在跳跃表中，如果一个结点有 A + ] 个指针，则称此结点为一个 A; 级结点。 

以图 7-5(c) 中跳跃表为例，我们来看如何在该跳跃表中搜索元素8。从该跳跃表的最髙 
级，即第2级开始搜索。利用2级指针我们发现兀素8位于结点7和19之间。此时在结点7处 
降至1级指针继续搜索，发现元素8位于结点7和13之问。最后，在结点7处降至0级指针进 
行搜索，发现元素 S 位于结点7和11之间，从而知道元素8不在所搜索的集合 S 中。 

在一般情况下，给定-一个含有 a 个元素的有序链表，我们对以将它改造成一个完全跳跃 
表，使得每一个级结点含有 A + 1个指针，分別跳过 2 A - - 1，… ,2 e - 1个中间结点。 

第 f 个 A 级结点安排在跳跃表的位置处^ >0。这样就可以在0(1%幻时间内完成集合成 
员的搜索运算。在一个完全跳跃表中，最高级的结点是 「logd 结点。 

完全跳跃表与完全二叉搜索树的情形非常类似。它虽然叫以有效地支持成员搜索运算，但 
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不适应 f 集合动态变化的情况。集合儿素的插人和删除运算会破坏完仝跳跃表嗥介的平衡状 
态，影响后继元尜搜索的 效率。 

为了在动态变化屮维持跳跃表屮附加指针的平衡性，必须使跳跃表中 A 级结点数维持在 
总结点数的一定比例范围内 。注 意到在一个完仝跳跃表中，50%的指针是0级指针 ; 25%的指 
针足 I 级 指针;…； （100/2 U 1 )% 的指针是 A 级指针。因此，在插人一个元素时，我们以概率】/2 
引入••个 U 级结点，以概率1/4引人一个〖级结点，…，以概率】 /2 y _ w 引入一个 A 级结点..另- 
方向，一个纟级结点指叫下一个冋级或更高级的结点，它所跳过的结点数 X 再准确地维持在 
” - 1。经过这样的修改，我们就町以在插入或删除一个元素时，通过对跳跃表的局邵修改来 
维持其平衡性。跳跃表中结点的级别在插入时确定，一旦确定便不冉史改。图 7-6 是遵循上述 
原则的跳跃表的例子。对其进行搜索与对完全跳跃表所作的搜索是一忏的。 



I 
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m 7-6 跳跃表示例 

如果希望在图 7-6 所示的跳跃表屮插人一个元素8,则应先在跳跃表中搜索其插入位置。 
经搜索发现应在结点7和11之间插入元素8。此时在结点7和11之间增加1个存储元素 S 的 
新结点，并以随机的方式确定新结点的级别。例如，如果兀素8是作为一个2级结点插入，则应 
对图 7-6 中与虚线相交的指针进行调整如图 7-7(a) 所示。如果新插入的结点足一个1级结点， 
则只要修改2个指针，如图 7-7(b) 所示。图7 -6 中与虚线相交的指针是在插人新结点后有可能 
被修改的指针，这些指针可在搜索元素插入位置时动态地保存起来，以供实施插入时使用。 




( b ) 

图 7-7 在跳跃表中插入新结点 

在上述算法屮，关键的问题是如何随机地生成新插人结点的级别。我们注意到，在一个完 
全跳跃表中，具行 i 级指针的结点屮有一半同时具有1级指。为了维持跳跃表的平衡性, 
我们可以事先确定一个实数 p ，0< p < 1，并要求在跳跃表中维持在具有〖级指针的结点中同 
时具有 t + 1级指针的结点所占比例约为 p 为此，在插入一个新结点时，先将其结点级别初始 
化为0,然后用随机数牛成器反复地产生一个 [0,1) 间的随机实数^如果 q 则使新结点 

级别增加1,直至 g 3 " 由此过程可知，所产生的新结点的级别为0的概率为1 _ ^级别为1 
的概率为 p(l - />) ，…，级别为 i 的概率为 //(I - /; ) 。如此产牛的新结点的级别有可能是个 
很大的数，甚至远远超过表中元素的个数。为 f 避免这种情况，我们用 log 1/p n 作为新结点级别 

, 2 U • 


的上界。其中，〃足当前跳跃表中结点个数。当酣跳跃表中仟一结点的级别不超过在只 
体实现时，可用‘预先确定的常数 MaxLevd 来作为跳跃表结点级别的上界。 

下面我们来讨论跳跃表的实现细节，跳跃表结点类 S 由类 SkipNode 定义 如下： 

• • • •••••• • 

template < class EType, class KType > class SkipList; 
template < class EType，class KType > 
class SkipNode J 

friend bkipList < EType^KTyjK? > ? 
private; 

SkipINiode(inL size) 

Inexl - new SkipNode < tTvpe t KType > ^ \ size] ; ! 

- SkipNodeO i delete [ ] nexl ； | 

EType data； 

SkipNode < EType, KType > * ^ next; // 指针数组 


其中， data 域存放集合中元素， next 是该结点的指针数组， next 、] 是它的 笫纟级指针篇 跃表由 


• 类 SkipList 定义如下： 

• • • ^ • • • • • ^ * • • • • ^ ^ 

template < class KType, class KType > 
class SkipList 5 
public: 

SkipList( KType Large, int MaxK = 10000， float p = 0.5)； 

~ SkipList0; 

bool Search(const KType& k, EType& e) const; 

SkipLkt < EType，KType〉& Insert (const EType& e); 

SkipList < EType, KType > & Delete( const KType & k r EType& e); 
void Output(); 
private : 
int LeveK ); 

SkipNode < EType& KType > 
int MaxLevel; 
int Levels; 

Random Number md; 
float Prob; 

KType TailKey; 

SkipNode < EType. KType > 

SkipNode < EType, KType > 

SkipNode< EType, KType > 

ii 


* Stt\eSearch(const KType& k); 

// 跳跃表级别上界 
// s 前最大级别 
//随机数产牛器 
//用于分配结点级别 
//元素键值上界 
^ //头结点指针 

* MIL ； //尾结点指针 

^ //指针数组 


其中， MaxE 是集合中元素个数的上限， P 的定义如前所述。跳跃表中0级链元素从小到大 
排列。 

跳跃表的构造函数初始化跳跃表的一些参数值，如 Prob, Levels, Max Level, Tail Key 等。 
析构函数释放跳跃表占用的所有空间。 


template < class EType，class KType > 


• 214 . 



SkipList < KTypet KType> : : SkipLisl(KType Large，int MhxE, float p) 

I // 构造函数 

Prob = p ; 

Max Level = ceil(log( MaxE) / log( 1/p) ) — 1; // 初始化跳跃表级別 L 界 
TailKey = Large; // 元素键值 [；: 界 
Levels = 0; //初始化当前餃大级別 
//创建头 、尾结点 和数组 last 

htim] = new SkipNode < ETypc ， KType> ( Max Level + 1) j 

Ml, = nen SkipNode< ETypc^KType> (0); 

last - SkipNode < EType，KType > * [ Max Level + 】 1; 

NIL - > data = Large; 

// 将跳跃表初始化为空表 

for (int i = 0; i < = Max Level; i 十 + ) 
liead - >next[i] = ML ； 


template < crlass EType，class KType > 

SkipList < EType, KType> ::: - SkipUstO 


!// 析构函数 

SkipNode < EType, KTypp > * next; 

// 删除所有结点 
while (head ! = NIL) j 
next = head- > next[0j; 
delete head; 


heaii = next ； 


NIL； 

delete [ ] last ； 


对跳跃表所表示的有序集的搜索、插人和删除等运算均要求对类 ET yp e 进行重载，以便 
在 EType 与 KType 的成员间进行比较，并明确 EType 和 KType 成员间的相互赋值的定义。 
例如，当 EType 和 KType 分别是 int 和 long 时，其元素重载定义 如下： 

class element i 

friend void main(void); 
public: 

operator long() const ?return key ； I 
clement & operator = (long y) 

1 key ~ y ； return * this; ( 
private: 

int data; 
long key ； 



SkipList 类有两个搜索函数。当需要搜索集合中键值为的元素时，可用共亨成员函数 
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Search 来搜索。当 Search 搜索到键值为 A 的元素时，将该元素返 M 到 e 中，并返回 Imn ， 杏则 
返回 fd Sei . 算法 St ^ r : h 从最高级指针链开始搜索*一直到0级指针链。在每一级搜索屮尽可 
能地接近要搜索的兀素。当算法从 for 循环退出时，正好处在欲寻找元素的左边。与0级指 

钟所指的下一个元素进行比较，即可确定要找的儿素是否在跳跃表屮。 

. . . • • • - * * 

template < class ETvpe, class KType> 

bool SkipList < KType 1 KType> : : Search(const KTyp^& k ， EType& e) const 
i // 搜索指定兀素 k 

If (k > = TailKcv) relurn false; 

// 位置 P 怆好位于指定元素 k 之前 

SkipNode< ETypetKType> *p = head; 
for (int i = Levels; i > = 0; i - - ) // 逐级向卜搜索 

while (p- > aexi[i] - > data < k) // 在第 i 级链中搜索 

p = p- > nexLiJ; 
e = p- > next[0] - >fiata; 
return (e = = k); 

0 

. -" - ''' * 

SkipLisl 的第 2 个搜索函数是私有成员函数 SaveSewch 。 由插人和删除操作来调用。 
SaveSearch 除了完成 Search 的功能外，还把每一级中遇到的上一个结点存放在数组 last 屮，供 
插入和删除操作修改跳跃表指针时使用。 

«••••• m ^ mm • 鬌 鑄馨 藝籲拳 _ _ I \ k I - ^ • • 

template < class EType，class KTyp^ > 

SkipNode< EType, KType > ^ Skip List < EType, KTy^> :: SaveSearuh{ const KType& k) 

I// 搜索指定元素幻并将每一级中遇到的上一个结点存放在数组- 〖 中 
// 位置 P 恰好位于指定元素 k 之前 

SkipNode< ETy^, KType > x p = head; 

for (int i - Levels; i > = 0; i - )1 

while (p- > nextLij - > data < k) 
p = p- > nexl[i]; 

Ust[i] = p ； // .1" 一 个第 i 级结点 

I 

return (p- > next[0]); 


在跳跃表中插人-个元素的算法可描述如下。在插入一个新结点时，算法随机地为其分 
配一个结点级别。当要插人的元素键值超过 TailKey 或表中已有相同键值的元素时，函数 
Insert 将引发 Bacilnput 异常。如果在执行插人时已没有足够的空间，则由 new 引发一个 

NoMem 异常，当元素 e 被成功插人后， Insert 返回跳跃衣。 

. . . - . k 1 * 

template < class EType, class K r [\pe> 
int SkipList < EType，KType > : : LeveK ) 

)// 产生不超过 MaxLevel 的随机级别 
int lev = 0; 

wfiik (rnd.fRandoTn( ) < Prob) lev + + ; 
return (lev < ^ MaxLevel) ? lev : MaxLevel; 
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template < class ETyp^t K Type > 

SkipList < EType, KType> & SkipList < ETypt* ， K 【 ype> :: Insertf const vpt & e) 

： // 插入指定兀素 ^ 

K Type k - e; // 取得儿素键值 

if ( k > = TailK^y) Uiruw Badlnput(); // 元素键值超界 

// 检査元素是否已存在 

SkipNode< EType,KTypo> = SaveSearch( k); 
if (p - > data = ^ c) throw Biidlnput(); // 元素已存在 
// 素不存在，确定新结点级别 

int lev = Level 0 ; 

//调整各级別指针 
il' (kv > Leveb)) 

for (int i - Levels + 1; i < = lev; i + + ) 
iast[i] = head; 

Levels = lev;' 

// 产生新结点，并将新结点插人卩之后 

SkipNode < EType, KType > = n«w SkipNode < EType* KType > (lev + J ); 

y - > data = e; 

for (int i = 0; i < = lev: i + + ) 1 

// 插入第 i 级链 

y- >next.i] = lastLij - > next! il; 
laslfi] - > next[ij = y ； 

I * 

return « this; 


从跳跃表中删除一个兀素的算法可描述如下。该算法用来删除跳跃表中键值为的元 
素，并将所删除的元素存放在 e 中。在算法的执行过程中，若没有找到键值为〖的元素，则引 
发 Badlnput 异常。算法中的 while 循环用來修改 Levels 的值，找出至少包含一个元素的指针 

级别。当跳跃表为空时， Leveis 被置为 0 。 

* • • • # # * 

lemplate < class EType t class KType > 

SkipList < EType T KType> & SkipList < EType, KType > :: Delete 

(const KType& k, EType & e) 

\// 删除键值为 k 的元素，并将所删除元 家存人 e 

if (k > = TailKey) throw BadlnputO; // 儿素键值超界 

// 搜索待删除元素 

SkipNode < EType ， KTy^ > * p = SaveSearch( k); 
i( (p~ >tia1a ! = k) llirow Badlnput(); // 未找到 
// 从跳跃表中删除结点 

for (int i = 0; i < = Lad & & last L iJ - > next[i] = = p; i+ + ) 
lastLi- 1 - > next[i] = p- > nexl[i ]； 

// 更新气 前级别 

while ( Levd > 0 && head - > wxt[levels. = = NIL) 
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e = p- > data; 
delete p ； 
return ^ this; 


template < class ETypc, class KTyj>^ > 
void SkipList < EType,KType> : : Oulpul() 

!// 输出集合屮元素 

SkipN ode < EType,KType> ^ y = head - > uexlLOj; 
fur (; y ! = NIL; y = v - > rwxl ； 0] ) 
cout < < y - > data < < …； 
cout < < erdl; 


当跳跃衷中有 〃 个乂素时，在最坏怡况下，对跳跃表进行搜尜、插人和删除运算所需的计 
算时间均为+ MaxLeve 〗)。 在最坏情况下，可能只打一个 Max Level 级的元素，其余元素 
均在0级链匕此时跳跃表退化为有序链表。由于跳跃表采用 r 随机化技术，它的每一种运 
算(搜索、插入和删除)在最坏情况下的期望时间均为 O ( lagn ), 

在一般情况下，跳跃表的1级链上大约有 n * p 个元荼，2级链上大约有 n * 〆 个元素， 
…，纟级链上大约有 n * 〆 个元素.闪此跳跃丧指针域占用空间的平均值是= n /(] - 

t 

/>)。即跳跃表所占用的空间为 0 UK 特別地，当 p = ( K 5 时，约需个指针空间。 

7.4 拉斯维加斯 (Las Vegas ) 算法 


舍伍德型算法的优点是其计算时间复杂性对所行实例而言相对均匀。但与其相应的确定 
性算法相比，其平均时间复杂性没有改进。拉斯维加斯算法则不然，它能显著地改进算法的有 
效性。甚至对某些迄今为止找不到有效算法的问题，也能得到满意的结果。 

拉斯维加斯算法的一个显著特征是它所作的随机性决策有可能导致算法找不到所需的 
解。因此通常用一个 bool 型函数表示拉斯维加斯型算法。当算法找到-个解时返冋 true ， 否 
则返回 false 。 拉斯维加斯算法的典型调用形式为 buol success = LV ( x . r ); 其中$是输入参 
数;当 success 的值为 t rue 时， y 返回问题的解 。当 success % false 时，算法未能找到问题的一 

个解。此时町对同一实例 W 次 独立地调用相冋的算法。 

设对输人2调用拉斯维加斯算法获得问题的一个解的概亨。一个正确的拉斯维 
加斯算法应该对所有输入％均有/ > U )>0。 在更强意义下，要求存在一个常数3 >0,使得对 
问题的每一个实例％ 均有 〆 夂设 sU ) 和 eU ) 分别是算法对于具体实例 x 求解成功 
或求解失败所需的平均时间，我们来考虑下面的算法： 

• • • • 

void 0bstinal^( InputTvpe x, Output Type ) 

i// 反复调用拉斯维加斯算法 LV(x^y), ft 到找到问题的 “个解 >• 

bool success = false; 

while ( ! success) succors = LV( x ， v); 
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由于 pG ) >0,故 U 要有足够的时间，对仟何实例3 ,上述肴法 Obsthate 总能找到问题的 
-个解。设 fG ) 是算法找到具体实例^的一个解所需的平均时间，则冇 

K 工 ） = p ( .V ) Jf ( .V ) + (1 - /； ( x )) ( € {.r ) + t ( x )) 

解此方程可得 

f ( x ) = s ( X ) + 1 e ( x ) 

p\x) 

7.4.1 n 后问题 

n 后问题为我们提供了设计高效的拉斯维加斯算法的很好的例子。在 fflW 溯法解 n 只问 
题时，实际 L 是在系统地搜索整个解空间树的过程屮找出满足要求的解。但我们忽略了一个 
軍:要事实 :对于 n 后问题的任何-•个解而吉，每一个皇后在棋盘上的位置无任何规律，不具有 
系统性，而更像是随机放 H 的。由此界易想到下面的拉斯维加斯算法。我们在棋盘上相继的 
各行中随机地放置皇后，并注意使新放置的皇后与已放置的皇后互不攻士，直至〃个皂€均 
已相容地放置好，或已没冇下一个皁后的町放置位置时 为止。 

具体算法可描述如下。类 Queen 的私有成员 n 表示皇肟 个数； 数绀 x 存储 n 后问题 
的解。 


class CKieen i 

// 测试呈 k 置于第 xU ] 列的合法性 
// 随机放置 n 个皇后拉斯维加斯算法 
// $.6 个数 
// 解向 M 

类 Queen 的私有成员函数 PlaceU ) 用于测试将皇后 A 置于第 x [ A ] 列的合法性 。 

• 審 

bool Queen ： : Pliicc{mL k) 

;// 測试皇后 kS 尸第奵 ㈧ 列的合法仕 

for (ini j = 1 ;j < k; j + + ) 

if ((abs( k 一 j) = = ahs(x| jl - k」))j |( ： x[ j 」 = - x[k J ) ) return false; 

return true ； 


inend void nQueen(int); 
private ： 

lx)ul Place(int k); 
boul QueensLV ( void); 
hit n, 


类 Queen 的私右成员函数 QueensLV ( void ) 实现在棋盘上随机放置 n 个皇后的拉斯维加 
斯算法： 

ImioJ Queen: : Qu^nsrA Cvoid) 

;//随机放置 n 个皇后的拉斯维加斯算法 
Random Numliei rnd; // 随机数产生器 

ir^k^l; // T 一个放 S 的皇后编号 


int c (hjK = i ; 
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while (( k < = ri) & & ( count >0)) : 
count = (}; 
iat j = 0; 

for ( int i = 1 ； i < = n; i + + ) ; 
x[k] = i; 

if awk)) 

if (rncL Kand<>ui( + + coufit) = = 0) j = i; // 随机位置 

I 

if (count >0) x[k + + 1 =j ； 
return (count > 0) ; // count > 0 表示放置成功 


类似于算法 Obstinate ， 我们可以通过反复调用随机放置 n 个皇后的拉斯维加斯算法 
QueensLVO, 直至找到 nfi 问题的一个解。 

• • - • • _ • • • • _ • • • • • * • 

void nQueen(int n) 

;//解 n 后问题的拉斯维加斯算法 

拿 

Queen X ； 

//初始化 X 

X - u = n; 

int ^ p - new int f n + 1"!; 

for (inL i = 0; i < = n ； i + + ) 
p[ij = 0; 

X. x = p; 

// 反复调用随机放置 》 个皇后的拉斯维加斯算法,直至放置成功 

whilt? ( ! X. QueensL V ()) ; 
for (int i= 1 ;i< = Ji;i + + ) 
cout< < p[l] < < " ； 

cout < < end); 
delete [ j p ； 


上述算法一 li 发现无法再放置下一个皇后，就要仝部重新开始。如果将 t 述随机放置策 
略与冋溯法 相结公 ，町能会获得更好的效果。我们町以先在棋盘的若干行中随机地放置皇后， 
然后在后继行中用回溯法继续放置，紅至找到一个解或直告失败。随机放置的皇后越多，后继 
回溯搜索所需的时间就越少，但失败的概率也就越大。 

与回溯法相结合的解 n 后问题的拉斯维加斯算法描述如 F : 

• • • • •• 91,1 • • • • \ • 

chss Queen i 

friend void nyue(f 【 i(iiU); 
private ： 

bool Piace(int k); // 测 试皂后 k 置于第 X[ k ] 列的合法性 

void Backtrack (int t); // 解 n R 问题的回溯法 

bool QueensL,V(int stopVc^as); // 随机放置 n t 拉斯维加斯算法 

int n, * x, ^ y; 
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类 Queen 的私有成员函数 PlaceU ) 用于测试将皇£1置于第4幻列的合法性。 
类 Queen 的私存成员函数 Backtrack ⑴足解 n 后问题的冋溯法。 


bool Queen： : Pkce(int k) 

\" 测试皇后 k 置于第 x Lk ] 列的合法性 

for (int j = 1 ;j < k;j + + ) 

if ((abs(k - j) = = abs(^l j] - x[kj)) J Kx[j "； = = x[k] )) return false; 
return *ruc; 


void Queen ： ： Backtrac k!int t) 

i // 解 n 后问题的回溯法 

if (t> n )； 

for (Jnt i = 1 ; i < - n;i + + ) 
y[ i] = x[ij; 
return; 

I 

I 

I 

else 

for (ini i=l ； i<=n ； i+-f) \ 

x.U = i ； 

if ( Place(t)) Backtrack( t + I); 


类 Queen 的私有成 M 函数 QueensLV( stop Vegas ) 实现在棋盘上随机放置若干个空后的拉 

斯维加斯算法。其中， IsstopVepssn 表示随机放置的皇后数。 

• • § • • • • • • • • • • 

bool Queen ： ； yueenftLV(int s ； opV>gas) 

i // 随机放置 n 个邕后拉斯维加斯算法 

Random Number md; 

intk-li // 随机数产生器 

int count = 1; 

// 1 矣 Stop Vegas 矣 I 】表示允许随机放置的 5 •数 

while ((k < = stopVe^cUs) & ^ (c-ount > 0)) \ 
count = 0; 
int j - 0; 

for I, ini j=l; i< =n; ii- + ) < 
x；kj = i ； 

if (Flace(k)) 

if (rnd. Handom( + +■ count) = = 0) j = i; // 随机位置 

l 

if (count > 0) xLk + + ] = j; 

j 

r^lum (count > 0); // counl > 0 表 7K 放 S 成功 
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算法的回溯搜索部分与解 n 后 M 题的 iH ] 溯法类似，所不同的是这里只要找到一个解就吋 
以了. 

void nQueen(int n) 

?// 勹回 溯法相结合的解0后问题的拉斯维加斯算法 
Qu^n X \ 

// 初始化 X 
X . II = n ; 

ini x ]} = new int [n + J 」 ； 
ini * q = new int [n + 1 _; 
lor (int i ^ 0; i < = n!]++) j 

p[ij = o ； 
q[iJ = 0;； 

X.y = p; 

X - X = q ； 

int stop ^ 5 ; 

while ( ! X. QuccnsLV(stop)); 

// 算法的回溯搜索部分 

X, Backtrack(stop + 1); 
hr (int i ^ 1 ;i < - n;i + + ) 
cout< < p[ij < < ” "; 

cout < < endl; 
delete L J p; 
delete [ ] q; 


尸面 的表 7-〖 给出了用上述算法解 8 后问题时，对于+同的 stopVegas 取值，算法成功的 
概率一次成功搜索访问的结点数平均值^ 一次不成功搜索汸 M 的结点数平均值 e ， 以及反 
复调用算法使得最终找到一个解所访问的结点数的平均值 p ) e/ po 


表 7-1 解8后问题的拉斯维加斯算法中不同 stopVegas 值所相应的算法效率 


stop Vegas 

P 


• 

i 

e 

i 

i 

t 

0 

KOOOO 

r • • ― •-■•麵 

114.00 

— 

114,00 

I_ 

1 

1 ,oouo 

39.63 


一 

39.63 

2 

0.8750 

22.53 

39.67 

■ 

28.20 

3 

0.4931 

' 13.48 

15.10 

29.01 

4 

0,2618 

10.31 _ 

t - -- 

8.79 

35.10 

5 

0.1624 

9.33 

7.29 

46.92 

6 

0,1375 

9.05 

6.98 i 

53.50 

7 

(K 1293 

9.00 

6,97 

55.93 

8 i 

0.1293 

9.00 

6.97 

55.03 


stopVegas ^ O 相应 f 完仝使用回溯法的情形。 
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衷 7-2 是当 《 = 12 时，关 r 若〒 dopVegas 值的统汁数据。由此可以看出当^ : 12 时，取 
stopVegas - 5 til ，算法效率很高。 

表 7-2 解 12后问题的拉斯维加斯算法中不同 stopVegas 值所相应的算法效率 


slop Vegas 

一 P 


(_ t 

0 

1 • 0(X)0 

262,00 

• 

262.00 

5 

0.5039 

1 

33.88 

47 . 23 

80.39 

12 | 

0.0465 1 

1 13.00 

KJ.20 

mmmm 


7.4.2 整数因子分解 

设 n > 1是一个辂数。关于轉数 n 的闪？ 分解问题是，找出〃的如下形式的惟-♦分 解式: 

m . m . 

P \>2 -… 户 〆 

其中 ， pj < P 2 〈… < Pk 是 k 个素数，爪1， 肌1，…， TUk 是 k 个正整数。 

如果 n 是一个众数，则 n 必有一个非平 凡因子 X ，1 < ^ < 、使 得: r 可以整除； i 。 给定一 
个合数^求〃的一个非平凡因子的问题称为整数 n . 的因子分割问题。 

在本章的下一节中我 们会讨 论-个用于测试给定整数的素性的蒙特转罗算法。冇了测试 
素性的算法后，整数的因了，分解问题就转化为整数的因子分割问题。 

下面的算法 S p lU ( n ) 可实现对整数的因子分割、 

■ 谷 8 t I • 

ini split(int n) 

I 

< 

I 

ini m - floor(sqrt( doiil)lp( n))); 
for (inL i = 2; i < = in; i + + ) 
if ("%i= =0) return i; 
return 1; 


在最坏情况下，算法 s P ht(0 所需的计算时间为 rKvG)。 当^较大时， h 述算法尤法在 
可接受的时 间内完 成闪子分割任务：对于给定的£整数^设其位数为 ^ = rio gl0 (! + ^)io 

由 A = tfU(r /2 ) 知，算法 S p mu) 足关于 w 的指数时间算 法、， 

到 H 前为止，还没有找到解 H 子分割问题的多项式时间算法。事实 h， 算法 S P lhU) 是对 
范阑在 1〜 x 的所有整数进行了试除而得到范削在1〜/的任一整数的因: F 分割。下面我们 
要讨论的求整数《的因子分割的拉斯维加斯算法是由 Poikd 提出的，该算法的效率比算法 
SplitU) 舍较大的提髙。 Pollard 算法用与算法 S p litU) 相同的 工作量 就可以得到在1 ~ x 4 范 
围内整数的因子分割。 

Pollard 算法在开始时选取0〜 - 1) 范围内的随机数 : c,， 然后递归地由 

2 

a -, = ( 】一 1 ) mod n 

产生无穷序列心，叼，"、七，_”。 

对于 k 2、 h 0,1，…，以及 f < ^2“ \算法 i|’ 算出' - Xl ^ n 的最大公因子 

d - gcd( Xj - .t, , n ) 

如果4是《的非平凡因子，则实现对 n 的- ••次 分割，算 E 输出《 的因了 

求整数/ I闪子分割的拉斯维加斯算法 PWardU) 町描述如下，其中， go]U ，6) 是求2个 

- 223 - 




整数最大公闪数的欧 几 里得算法。 

int grfl(int a, int b ) 

;// 求整数 a 和 b 最大公囚数的欧儿里得算法 

if (b = =0) return a; 
else return grd( li.a^h); 


void Follard(int n) 

：// 求整数 n 因子分 割的拉 斯维加斯算法 

Random Nuiniier rnd; 
int i = 1; 

int x = rmi. Random(n); // 随机整数 



int k = 2; 
while (true) 


X = (x * x- l)%n; // x s = (x?. t - I )modn 

int d= gcd(y - x ， n); // 求 I 、的北平凡因 + 

if ((d > J) & & (d < n ) ) cout < < d< < endi; 
if (i = = k) i 

V = X; 

w 

= 2 ;' 


对 Pollard 算法更深人的分析蜊知，执行算法的 while 循环约次后* Pollard 算法会输出 
u 的一■个因子 ft] 于 n 的最小素因子 p ^ /n , Aif Po]】ard 算法 "J 在0 ( « 14 )时间内找到 n 
的一个素因子。 

在上述 Pollanl 算法屮还可将产生序列\的递！ H 式改作 



其中， c 是一个不等于0和2的整数。 

7.5 蒙特卡罗 (Monte Carlo ) 算法 

在实 p 小应用中我们常会 遇到一 些问题，不论采 m 确定性算法或概率算法都无法保证每次 
都能得到正确的解答。蒙特卡罗算法则在一般情况下 " 了以保证对问题的所有实例都以高概率 
给出正确解，但是通常无法判定-个具体解足否正确。 

7,5.1 蒙特卡罗算法的基本思想 

、& P 是一个实数 l/2< a < u 如果-个蒙持卡罗算法对于问题的任 -- 实例得到正确 
解的概率不小于，则称该蒙特卡罗算法是正确的 >且称 ；) _ 1/2足该算法的优势。 

如果对于 同-实 例，蒙恃 f： •罗算法: f 会给出两个不同的正确解答，则称该蒙特卡罗算法是 
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一 致的。 

有些蒙特 P 罗算法除 f 具4措述 M 题实例的输人参数外，还 U 有描述错误解可接受概率 
的参数。这类算法的计算时间复杂性通常由问题的实例规模以及错误解可抟受概率的函数来 
描述。 

对于一个一致的卩 正确蒙 特卡罗算法，要提高获得正确解的概率，只要执行该算法若 _f 
次，选择出现频次最高的解即可、 •. 

在一般情况下，设€和3是两个 TU 实数，且 e + 1/2。设 \1CU) 是一个一致的 （1/2 + 

e) 正确的蒙特卡罗算法，且 Q = - 2/Jog (1 ^4e 2 ) 0 如果我们调用算法 MCU ) 至少 
「C e bgl/W 次，许返 IH] 各次调用出观频 数最高 的解，就4以得到解冋•问题的一个一致的 （1 - 

幻正 确的蒙特卡罗算法。由此可见.不论算法 MCh ) 的优势 e >0多小，我们都可以通过反 
复调用来放大算法的优势，使得最终得到的算法具介可接受的错误概宇 

要证明I：述论断，设《 > 是重复调用 U/2+OiH 确的算法 MCU) 的次数， 

p = ( 1/2 + e)，y = l - p = ( 1/2 - e ) , m = L n/2」+ 1 。经 ~ 次反复调用算法 MC( x) ,找到问题 
的一个正确解。则该正确解至少应出现 m 次，因此其出现错误概率最多是 


m_ I 

Y ^? wb \ n 次调用出现 f 次止确解; 
1^0 



^ ( pq ) ，?/2 

& 二 0 \ 4 / 



(由于 q/p < 1， H- n ^2 - i ^ 0 ) 


= ( pqY i / 2 2 n 

= (4 ㈧ ) n/1 
=(1 - 4e 2 ) ,l/2 

^ (1 - 4e 2 )^ /2) \og(l/d) ( 由于 0 < {1 - 4e 2 ) < 1 ) 
一 2 - 


=d (由于对任意; t > 0冇 x l/]o ^ x ^ 2) 

由此可知重复次调用算法 MC ( x ) 得到正确解的概率至少为〗-夂 
更进一步的分析表明，如果 重复调 用一个一致的 （1/2 + e) It 确的豢特卡罗算法 2m _ 1 
次，得到 TH 确解的概率至少为1〜夂其屮， 

(1 - 4e 2 )^ 

/ '― 

4e \ 7 zm 

在实际使用中，大多数蒙特片罗算法经重复调用 g 止确率提高很快。 

设 MCU) 足解某个判定问题 D 的蒙特卡罗算法。3 MCU) 返冋 tme 时解总足正确的， 
仅当它返回 false 时行可能产生错误的解。我们称这类的蒙特卡罗算法为偏真算汰 u 

显而易见，当多次调用--个偏真蒙特卡罗算法时，只要4 一次调 ffl 返冋 tr#， 就可以断定 
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相应的解为 true。 稍后我们将看到，在这种情况卜\只要:$:复;周用偏真蒙特卡罗算法4次，就町 
以将解的正确率从55%提卨到95%，重复调用算法6次，可将解的 正确率 提卨到99%。而且对 
于偏真蒙待卡罗算法时言，原来对 P 正确笄法的要求# > 1/2可以放松为 p > 0即可。 

现在我们回到…般问题，即所 i 寸论的问题不一定是-个判定 H 题。设作是所求解问题的 
一个特殊的解答，如判定问题的 Uue 解答。对于一个解所给 M 题的蒙特片罗算法 MCU), 如罘 
存在问题实例的子集X 使得： 

(1) 当; c 务 义时， MC(；0 返冋的解足正 确的； 

(2) 当$ 6义时，止确解是 >0 ,但 MCU) 返冋的解未必是 70 。 

我们称上述算法 MC( x) 是偏 yo 的算法。 

设 MCU) 是一个一致的，/>正确偏蒙特卡罗算法. MCU) 返 W 的解为。我们来讨论 
以下两种 情形： 

(1) y = yo 的情形 i 

此时， MC(z) 返回的解足止确的 r 

事实匕当 z § JV 时， MCU) 返凹的解总是正确的。当 y 6 X时，正确解足: To, 故此时， 
算法返回的解也是止确的。 

(2) y y 0 的情形： 

在这种情形下，当 . v 各 A ： 时， y 是正确的。当 ； t 6尤吋， y 是错误的 s 因为此时正确解是 
Yc ，而/ : k 。。 但是由于算法 是；; 正确的，产生这种错误的概宇不超过】 - 
在一般情况下，如果重复 A 次调用\1以1)，所返刖的解依次为 yu-OkM 

① 存在/使= yo , 此时为正确解； 

② 存在 i / y， 使得 yi _义，此时必有1 &尤，因此吋知正确解为 n>; 

③ 对所有纟奋>,=： y， 但^， ）D ， 此时，正确解仍有可能足 >0。 

如果情形 3) 发生，则每一次调用 MCG ) 均产生错況解 >，但发牛这种情况的概率不超过 

(1 - p) k 

由上向的讨论可知，重复调用一个一致的， p 正确偏蒙特卡罗算法 fe 次，可得到一个 
(1-(1- P ) A ) 正确的蒙特卡罗算法， R 所得算法仍是一个•致的偏％蒙特卡罗算法 y 特别 
地，调用一个偏真蒙特卡罗 算法& 次可将其正确概率从^提高到 （）-(1 - P ) k )o 

7.5.2 主元素问题 

设 T[h n] 是-个 含右、个元素的数组。当 | ^ I T[ 2 ] = -t! I > u/2 时,称元素 x 是数 
组 T 的主兀素。对于给定的输人数组 T， 考虑 F 面判定所给数组 T 娃否含有主元素的蒙特卡罗 
算法 Majority。 


HandomNumljer rod; 
template < class Type > 
bool Majority (Type ^ T, ini n) 

；// 判定主元素的蒙特卡罗算法 

int i = rnd. Random(u) + 1; 

Typex = T[ij; // 随机选择数组元素 

Ini k ^ 0; 
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for (int j = 1 ; j < = j + + ) 

if (TLj] = = x) k + + ; 

return (k > n/2); // k > n/2 时 T 含有主元素 


h 述算法对随机选择的数组兀素 Z ，测试它是否为数组 T 的主兀素。如累算法返回的结罘 
为 true ， 则随机选择的数组元素 X 是数组 T 的主元素，显然数组 T 含有主元素反之，如罘算法 
返 [ El 的结果为则数组 T 未必没有主元素。可能数组 T 含有主元素，而随机选择的数组元 
Mx +是 T 的主元素。由于数组 T 的非主元素个数小于 n /2, 故 h 述情况发生的概率小丁〗/2。 
由此可见上述判定数组 T 的主元素存在性算法是一个偏真的1/2正确算法;或换句话说，如果 
数组 T 含有主元素,则算法以大于1/2的概率返回 true ; 如果数组 T 没有主元素，则算法肯定返 
回 fals^o 

在实际使用时，50%的错误概率是不可容忍的。使用前面讨论过的重复调用技术可将错 
误概率降低到任何町接受值的范围内,，首先我们来看軍复调用2次的算法 Majoriiy 2 h ： 

I it I I t t I • • 

template < class Type> 
bool Majority2(Type * T，int n) 
f// S ： 2 次调用算法 Majority 
if ( Majority(T, n )) return true: 
else return Majority(T ， n); 


如果数组 T 不含主元素，则每次调用 Majurity ( T ， rt ) 返回的值肯定是 false ， 从而 Majority 2 
返回的值肯定也是 faW 。 如果数组 T 含有主元素，则算法 Majority ( T , n ) 返回 true 的概率 p 
大于 I / 2 ,而当 Majority ( T , n ) 返回 true 时， Majority 2 也返回另一方面， Majority 2 的笫 
-- 次调用 Majority ( T ,， i ) 返回 fake 的概率为 1 _ p ，第二次调用 Majority ( T , / i ) 仍以概率 p 返 
回 true - 因此当数组 T 含有主元素时 , Majority 2 返回 true 的概率是 p + ( l-/))p = l - ( l - 
p ) 2 > 3/4。也就是说，算法 Majority 2 Jfe 一 个偏真3/4正确的蒙特卡罗算法。 

算法 Majority 2 中 ，重复调用 Majority ( T , 幻所得到的结果是相互独立的：当数组 T 含有 
主元素时，某次调用 Majority ( T ，71) 返回 false 并不会影响下 一 次调用 Majority ( T ， a ) 返回值力 
true 的概率。因此， A 次重复调用 Majority ( T ， a ) 均返回 false 的概率小于 2- S 另 一 方向，在 
k 次调 用屮， 只要有一次调用返回的值为 true ， 即可断定数组 T 含有主元素 < 

对于任何给定的 e >0, 下面的算法 MajorityMC 重复调用 「 log(〗/e )1 次算法 Majority 。它 

是一个偏真蒙特卡罗算法，且其错误概率小于^ ' 

• • / • • • • • • • • • • • 

template < class Type > 

bool MajorityMC(Type * T，int double e) 
i// 重复 [ li)g(l/e)l 次调用算法 Majority 
int k = ceil (log( 1 /e)/log( 2 ))； 
for (int i = 1; i < =k;i + + ) 

if ( Majority( n) ) return true; 
rfttum false; 
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算法 -\lajorh〉MC 所 W 的 U 算时间 5 ?. 然是 0 ( r?log( 1 /e ) )。 

7.5.3 素数测试 


关于素数的研 究巳有 相当长的历史，近代密码学的研究又给它注人了新的活力。在关于 
素数的研究中素数的测试是一个非常审要的问题。 Wilson 定理给出了一个数足素数的充要 
条件。 


Wilson 定理 对于给 定的正 整数 〃，判 定《是一个荼数的充要条件是 

(n - 1 ) ! = - 1( mod n ) 

Wilson 定理有很高的理论 价值。 但实际用于素件:测试所需计算量太大，无法实现对较大 
素数的测试。到 H 前为止，尚未找到素数测试的有效的确定性算法或拉斯维加斯型算法。 

首先容易想到下面的桌数测试概率算法 Primeo 


bool Prime( unsigned int n) 

Handom Ninnl^er rnd ； 
int m = flc)u「( sqrt( double( n))); 
unsigned int a= rnd. Kandorn( m - 2) + 2; 
return (n%a! = 0); 

I 

.• I • • • • • • • • j 

算法 Prime 返冋 false 时，算法幸运地找到 〃 的一个非平凡因子,因此可以肯定一个合 
数。但是对于上述算法 Prhne 来说，即使《是一个合数，算法仍以高概率返回 true 。 例如，当 
^ = 2 623 = 43 x 61时，算法 Prime 在2 〜 51 范围 内随机选择一个整数、仅当选择到 
a = 43时，算法返回 fake , 其余情况均返回 true 。 在2 〜 51范围内选到《 =43的概率约为2%， 
因此算法以98%的概率返回错误的结果 tn ^、 当〃增大时，情况就更糟。当然在上述算法中可 
以用欧几里得算法判定《与^是否互素来提高测试效率，但结果仍不理想。 

著名的费尔马小定理为素数判定提供了一个有力的丄具。 

费尔马小定理如罘/>是 一 个素数， H . 0 < a < p ，则 a p_l 5 1 (mod p ) 0 

例如，67是一个素数，则 2% u ) d 67 = 1。 

利用费尔马小定理，对于给定的整数《，可以设讣-个素数判定算法。通过计算 
d = mod n 来判定整数， I 的素性，当1时， a 肯定不是 素数; 当^ = 1时， rz 则很可能 
是素数。但也存在合数 n 使得2〃_ ] 3 l(mod nK 例如，满足此条件的最小合数是 u = 341。为 
了提高测试的准确性，我们町以随机地选取整数 i < u n - 1,然后用条件= l(mod n ) 
来判定整数《的素性。例如对于 /I = 341，取 a = 3时，有3⑽三 56 (mod 341)。故可判定 n 不 
是素数。 

费尔马小定理毕竟只是素数判定的一个必要条件。满足费尔马小定理条件的整数 a 未必 
全是素数。有些合数也满足费尔马小定理的条件。这驻合数被称作 C & michad 数，前3个 
Carmichael 数是561，1 105和1 729 ' Carmichael 数足1卜常少的。在】〜100 000 000范围内的整 
数中，只有255个 Carmichael 数:' 

利用下面的二次探测定理可以对 h 面的#数判定算法作进一步改迸，以避免将 
Carmichael 数当作素数。 

二次探测定理如果是一个素数，且0 < x 则方程/ b l(mod p) 的解为 
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事实上，: t z $ 1( mod /;) 等价于 a 2 - 1 = 0( mod p )。 由此可知， 

(x - 1)(^; + l ) = 0( mod p ) 

故 p 必须整除 X - 1 或: t + lc 由 p 是素数且 0 < X < p 推出 -V ; 1 或 rt- = /; - U 

利用 _ 次探测定现，我们可以在利用费尔马小定理计算 a 的过枵中增加对于幣 
数 U 的二次探测。一旦发现违背二次探测条件，即4得出 〃 4、是素数的结论， 

下面的算法 power 用十计算 a p mod a ，并在计算过程中实施对 a 的二次探测。 


void power( unsigned inL a, unsigned ini p. un»igne<] int n, 

unsigned int & result, bool ^compusitt 1 ) 

\" 计算 a^nod n ， Jj • 实施对 n 的二次探测 

unsigned int x; 
if (p =： = 0) result = 1; 
else i 

power(a,p/2.n.x,composite); "递归计算 
result = (x ^ x)%n; // 二次探侧 

if ((result = = l) & &(x! = 1) & &(x! - n - 1)) 
rymposite = tuiti ； 

if ((p%2) = = I ) // p 是奇数 

resujt = (result ^ a ) % n ; 


在算法 power 的基础上，可设计素数测试的蒙持卡罗算法 Pnme 如下: 

• • 

bool Prime ( unsigned inL n ) 

i // 素数测试的蒙特 t ： •罗算法 

Random Number rnd; 

uiKsigned int a, insult; 

boul ^iirnpofeite - false; 

a = rruL Random{ n — 3) + 2; 

power(a^ n - K n. result ^ compo^te); 

if (compositeI I (resuit! = 1)) return faJse; 

else relurn true; 


算法 Prime 返回 false 时，整数 n —定是一个合数：闹当算法 Prime 返冋值为 tme 时，整 
数 n 在高概率意义下是一个素数。仍然可能存在合数 〃，对 r 随机选取的苺数 a ， 算法返问 
Uue Q 何对于卜_述算法的深人分析表明，当 n 充分大时，这样的基数《不超过 U -9)/4 个，由 
此可知 t 述算法 Prime 是一个偏假3/4止确的蒙特卡罗算法。 

正如我们前面讨论过的，上述算法 Prime 的错误概率可通过多次重复调用而迅速降低> 

重复 A 次调用算法 Prime 的蒙特卡罗算法 PrimeMC 可描述 如下： 

_ • 

bool F J rimeM C (unsigned int n> unsigned int k) 

I // 重复 k 次调 m 算法 Prime 的蒙特卡罗算法 

Randuin IN umber rnd; 
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ini a, result; 
b(K>l wiiiiposite = false; 
fur (int i=l;i< ^ k;i + + ) : 

a= rnd, Random(n -3) + 2 ； 

pOwer(a 1 n - 1. n, result t compusHe); 

if (couipobilel I (result! =0) r el urn false; 

I 

i 

return true ; 


易知算法 Prim ^ MC 的错误概率+超过 （1/4)、 这是一个很保守的估计，实际使用的效果 
要好得多。 


习题 7 


7-1 在实际 f 、 V : 用屮，常耑模拟服从止态分布的随机变量，其密度函数为 

1 

- V 

G 

其中，为均值, CT 为标准差. 

如果5和《是 （- 〗，】)中均匀分布的随机变 fi ， 且^ +严< 1，令 

P = s 2 + t 2 
q = V ( - 2 \np )/p 
u = sq 
v - tq 

则 w 和 t ， 是服从标准正态分布 U = 0 ，cr l ) 的 2 个瓦相独立的随机变暈。 

(1) 利用上述事实，设计一个模拟标准正态分布随机变量的 算法。 

(2) 将 h 述算法扩展到一般的止态分布。 

7-2 设有一个文件含有《个记录:. 

(1) 试设计一个算法随机抽取该文件中 m 个记录。 

(2) 如果事先不知道文件中记录个数，应如何随机抽取其中的⑺个〖己录。 

7-3 试设计一个算法随机地产生范 W 在1 ~ 〃屮的 m 个随机整数， ii 要求这 m 个随机 
整数互不相同。 

7-4 设 X 是一个含有, t 个元素的集合，从 X 中均匀地选取元素。设第&次选取时首次出 
现重复。 

(1) 试证明当 n 充分大时 J 的期望值为#心，其巾，/? = '/ tt /2 . 1.253, 

(2) 由此设计一个 il - 算给定集合％中元素个数的概率算法。 

7-5 试设计一个概率算法计算365!/340!365 25 ,并精确到4位冇效数字 c 
7-6 一个问题是易验证的是指对该问题的给定实例的每一个解，都可以有效地验证其 
正确性。例如求一个整数的非平凡闪子问题是易验证的，而求-‘个整数的最小非平凡因子就不 

是易验证的。在一般情况 " F ， 鉍验证问题未必是易解的。 

(1) 给定一个解易验证问题 P 的蒙特卡罗方法，由此设计一个相应的解问题 P 的拉斯维加 
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斯算法 

(2) 给定•个解易验证问题 P 的拉斯维加斯算法，由此设计一个相戍的解问题 P 的蒙持卡 
罗算法。 

1-1 用数组役拟冇序链表的数据结构，设计支持下列运算的含伍德®算法，并分析各种 
运算所需的计算时 间： 

(0 Predecee SS or 找出一给定元素; t 在有序集 S 中的前驱元素； 

(2) Successor 找出一给定元素: r 在有序集 S 中的后继元素； 

(3) Min 找出有序集 S 屮的最小 元素； 

(4) Max 找出行序集 S 中的最大元素。 

7-8 采用数 绀模拟畚序链表的数 据结构，设计一个舍伍德型排序算法，使算法最坏情况 
下的平均计算时间为 OU 3/2 ) u 

7-9 如果对于某一个 n 的值， ri 后问题无解，则算法将陷人死循环。 

( J ) 证明或否定卜述论断 :对于 n > 4， n 后问题有解。 

(2) 是否存在一个正数夂使得对所有〃会4算法成功的概率至少是占、 

7-10 设 7 ，是一个奇素数，1 ^ p - 丨，如果存在一个整数 y ， 1 up - 1，使得 
^ ^ j 2 (mod p ) f 则称）是^的模 p 平力根。例如63是55的模103平方 根试设 计一个求整 
数 a 的模平方根的拉斯维加斯算法。 

7 M 1 假设 Q 有一个算法 Prime ( rO 可用于测试整数 n 足否为一素数.另外还侖，个算 
法 S p litU ) 可以实现对合数《的因子分割。试利用这两个算法设计一个对给定整数 rz 进行因 
了分解的算法. 

7-12 (1) 试证明下面的算法 PHmality 能以80%以上的正确率判定给定的一个整数 ri 是 
否为素数。另一方面，华出整数《的一个例子表明算法对此整数 a 总是给出错误的解答，进而 
说明该算法 f 是一个蒙特卡罗算法。 

_ 0 _ I 瓤參 • 

boo) Priina]ity(int n) 

I 

if (gcd(n,30030) - - 1) return true; 
else return false; 


(2) 试找出上述算法 Primality 中可用于替换整数 30 030 的另一个整數，使得用此整数代 
替30 030后，算法的 TH 确率提高到85%以上，且允许整数《是非常大的整数。 

7-13 设 MC (; c ) 是一个一致的75%正确的蒙特卡罗算法，考虑下面的算法 

• • • • • • ^ ^ 

MC3(x) 

I 

I 

窗 

I = MC(x) ; 
u = MC( v) ; 

v = MC(x); 

if ((t ^ = u) I i (l = = \)) return t; 
return v; 
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(1) 试证明卜-述算法 MC 3 U ) 足一致的27/32正确的算法，因此是84%正确的。 

(2) 试证明如果 MCU ) 不是一致的，则 MC 3 U ) 的正确率有吋能低于 

7-14 设/ =丨1,2,…， [/ 是/的一个子集是一个偏假尸正确蒙特卡罗 
算法。该算法用于判定所给的整数1矣 x " 足杏为集合5屮的整数，即 x e 5。设？ = 1 _ 
由偏假算法的定义町知，对任意 X ^ S ProblMCU ) = true ! = 1。当 a ; $ S 时， 

FroblMC (^) = irue ! ^ "考 虑下面的产生 S 中随机元素的算法 GenRand 如下： 

... ." . . - . ..-••••- 

bool RepeatMC(int x，int k) 

I 

int i = 0; 

bool any = true ； 

while (ans& & (i < k)) | 

i + + ? 

ans = MC('x); 

! 

.. 

return ans; 


int GenRand(inl n t int k) 

I 

Random Number md; 

int x - rnd. Random(n) + 1; 

while (!RepeatMC(x,k)) x - rnd. Random(n) + 1; 
return x; 


假设由语句 x = rnd . Random ( n ) + 1 产生的整数 A ： G S 的概率为 r ，证明算法 GenRand 返 
回的整数不在 S 中的概率最多为 


I 

1 丄 r -k 

1 + 1 一 r? 

7-15 设算法 A 和 B 是解同一判定问题的两个有效的蒙特卡罗算法。算法 A 是一 个尸正 
确偏真算法，算法 B 则是一个 g 正确偏假算法。试利用这两个算法设计一个解同一问题的拉斯 
维加斯算法，并使所得到的算法对任何实例的成功率尽可能高。 

7-16 考虑下面的无限循环算法： 

. . % r I . r I ^ I • t • . % . ■ - - - - - * 

void PrinLPrimes(void) 


cout < < r 2' < < endl; 
cout < < f 3 < < endl; 
int n = 5; 
while (true) i 

int m = iloor( log( double( n))); 
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if ( Prime MCI n, m) ) cunt < < n < < emlli 
n =r n + 2; 


易知，每一个素数都会被上述算法输出。但是除了所有素数外，算法可能偶尔错误地输 fH 
某些合数。说明上述情况不太少可能发生。或更精确地，证明上述算法错误地输出 • •个 合数的 
概率小丁 1 %。 

7-17 试设计一个素数测试的偏真蒙特卡罗算法。要求对 f 测试的整数《，所述算法足一 
个关于 logu 的多项式时间算法。 

结合教材中素数测试的偏假蒙特卡罗算法，设计一个素数测试的拉斯维加斯算沄(参见 >J 
题7-15)。 

7-18 给定两个集合 S 和7\试设汁〜个判定 S 和 r ji 否相等的蒙特卡罗算法^ 

7-19 给定二个 n x «矩阵和 C ， 下面的偏假1/2止确的蒙特卡罗算法用 T 判定 

AB = C ^ 

• • • • § • 馨 

booi ProductCint * * A，int 乂 * B, int * * C, int n) 

i // 判定 AB = C 的蒙特卡罗算法 

Random Number rnd ; 
int * x - new int [n 十 1 ]; 
int * y = new int [n + 11; 
int ^ z = new int [n + 1 ]； 
for (ini i = 1 ;i < = n;i + + ) i 
xUJ - rnd . Random (2); 
if ( x 」」== 0) x [ i ] = ~ 1; 

Mult( B ， x ， y ， n); 

Mult(A，y ， z ， n); 

Mult(C ， x ， y,n); 
for (int i = 1 ;i < = n;i + + ) 
if (yrij! = zfi」return false; 
return true; 


算法所需的计算时间为 0( rt 2 )。 显然，当 AB = C 时，算法 Pri ) duct(A y B 9 C y u ) 返 [ h ] l 「 ue 。 
试证明当 # (:时，算法返回值为 fake 的概率至少为 i /2( 提 示:考 虑矩阵 A 5 - C 并证明当 
AB # (:时，将该矩阵各行相加或相减最终得到的行向暈至少有一半是非零向量: K 、 

7-20 给定两个〃 x 〃矩阵 A ,5,试设计一个判定4和 B 是否互逆的蒙特卡罗算法 c 
741给定阶数分別为 n ， n 和 2 a 的多项式和试设计一个判定 
p { x ) q { x ) . 的偏假1/2止确的蒙特卡罗算法，并要求算法的计算时间为 0 U )。 
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第 8 章线性规划与网络流 


学习要点 

• 理解线性规划算法模型 
. 掌握解线性规划问题的单纯形算法 
• 理解网络与网络流的基本概念 
• 掌握网络最大流的增广路算法 
■ 掌握网络最大流的预流推进算法 
-掌握网络最小费用流的消圈算法 
- 掌握网络最小费用流的最小费用路算法 
,掌握网络最小费用流的网络单纯形算法 

8,1线性规划问题和单纯形算法 

8.1.1 线性规划问题及其表示 

线性规划问题可表示为如下 形式： 


CjXj (8.1) 

a 

2 a u x t ^ ^ ^ 1 ， 2,… ，肌 i) (8.2) 

n 

X aj t x t - bj (j = wi! + 1 ^ 11 , mi + m 2 ) (8.3) 

i = i 
n 

a ht x, ^ b k (h = m 1 +m 2 +U > ^^i + ^2 +w 3) (8.4) 

i = i 

x t 0 (t - 1 ， 2,… ， n) (8.5) 


上面各式中，…，'是 a 个独立变童。 (8.1) 式是线件规划问题的 H 标函 数。 max 是 
maximize 的缩写，表示求极大值。稍后将看到求目标函数极小值 m ^ n 的线性规划问题很容易转 
换为与之等价的求目标函数极小值的线性规划问题。 (8,2) ~ (8.5) 式是线性规划问题的约束 
条件。 s . t •是 subject to 的缩写，表尔“满足于”;：(8.2)式有爪 i 个不等式（矣）约束; (8.3) 式有 

个等式 约束; （8.4) 式有 m 3 个不等式(多）约束。 (8.2) ~ (8.4) 式约束总个数为 m = Wl 

+ W2+ (8.2) 〜 （8.4) 式中系 数叫可 正可负，也可以足零。而所有约束的右端参数规定为 

非负数，即卜為0，）=】，2,"，，爪,但这只是一种约定而 D , 因为可以用 -i 去乘任何一个约束 

的两端。 (8.5) 式是线性规划问题的变量非负性约束条件。 

变量:…，〜满足约束条件 (8 .2) 〜 （8.5) 式的一组值称为线性规划问题的一个可 
行解。所有 可行解 构成的集合称为线件规划问题的可行区域。使目标函数取得极值的可行解称 
为最优解。在最优解处目标函数的值称为最优值。 
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行些情况下可能不存在最优解:通常有两种情况： 

⑴根本没有吋行解，即给定的约朵条件之 N 是相互排斥的，可行区域为空 
(2) 目标函数没有极值。也就是说,在 n 维空间的某个方向上，目标函数值可以无限增大， 
而仍满足约束条件，此时 H 标函数值无界。 

下面给 (h 线性规划问 题的- 个具体例子。 

max 2 = X] + X2 + 一文 4 ( 8 . 6 ) 

s. t . ^! + 2a ：3 ^ 18 

2 X 2 ^ 7^4 ^ 0 

x I x 2 + x 3 + x 4 - 9 (8.7) 

X 2 - + 2x 4 ^ I 

Xi^Oii = J,2,3,4) 

此例中， n = 4, m] = 2, mj = 爪 3 = \ 9 m = rri ] + m 2 + = 4o 

这个问题的解为 = (0,3.5,4,5，1); 最优值为16。下面将 if 细讨论如何 
求解。 

8.1.2 线性规划基本定理 

使约束条件 (8.2) ~ (S.5) 式中的某〃个约束以等号满足的可行解称为线性规划问题的 
基本可行解。若 u 则基本可行解中至少有《 - m 个分量为0。也就是说，基本可行解中最 

多有 m 个分量非零0 

线性规划基本定理 如果线性规划问题有最优解，则必有-基本可行最优解。 

上述定理的重要意义在于，它把-个最优化问题转化为一个组合问题，即在 （8.2) - 
(8,5) 式的 m + «个约束条件中，确定最优解应满足其中哪 n 个约束条件的问题。由此可知， 
只要对各种不同的组合进行测试，并比较每种情况下的目标函数值就能找到最优解。 

盲目测试的计算量很大 cDamzig 于1948年首先提出了针对这一问题的单纯形算法。.中 纯 
形算法的特点是： 

(1) 只对约束条件的若千绀众进行测试，测试的每一步都使 H 标函数的值增加。 

(2) 一 般经过不大于 m 或〃次迭代就可求得最优解。 

自从提出单纯形算法后，人们已从实践经验中得到单纯形算法的性质< 2)，但是直到1982 
年才由 Smale 给出其正确性的严格证明。 

8.1.3 约束标准型线性规划问题的单纯形算法 

当线性规划问题中没有不等式约朿 (8.2) 和 (8.4) 式，而只有等式约束 (8 ,3) 式和变暈非 
负约束 (8.5) 式时，称该线性规划问题具有标准形式^ 

为便于 W 论,不妨先考察一类更特殊的标准形式线性规划问题。在这类线性规划问题中， 
在每个等式约束中至少有〜个变量的系数为正，且这个变量只在该约束中出现。在每一约束方 
程中选择一个这样的变量，并以它作为变量求解该约束方程，这样选出來 的变量 称为左端变量 
或基本变量，其总数为= m 2 ) 个。剩下的 n - m 个变量称为右端变量或非基本变量。这类 
特殊的标准形式线性规划问题称为约束标准型线性规划问题。 
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虽然约束标准甩线性规划问题言常特殊，但是对于现解线性规划问题的中，纯形算法非常 
重要。稍后将看到，任意一个线性规划问题可以转换为约束标准细线件规划问题 
先看一个约朿标准型线性规划问题的例子： 


maxj = - x 2 + 3^3 - 

(8.8) 

U a 1 + 3x 2 一 + 2 文 5 = 7 


^4 - 2x 2 + 4^3 = 12 

(8.9) 

- 4^2 + 3a ：3 -f Sx 5 = 10 



Xi ^ 0 (i = l ,2,3,4,5,6) 

此例中 ，" - 6 y m = 3;某本变 fl 为 a ： 】，无4和^6;非基本变量为 工2，^3和 X 5。注意，这里的 
目标函数 (8.8) 式中仅包含非基本 变量。 这实际 h 并不是一种特殊要求，因为出现在 n 标函数 
中的基本变量可以用约束方程代人消去。 

对于任何约朿标准型线性规划问题， H 要将所有非基本变暈都置为0,从约束方程式屮解 
出满足约束的基本变暈的值，即可求得一个基本吋行解。当然，这个基本 uj 行解未必是最优解。 
单纯形算法的基本思想就是，从一个基本可行解出发，进行一系列的基本可行解的变换。每次 
变换将一个非基本变量与-个基本变暈互调位置，且保持当前的线性规划问题是一个号原问 
题完全等价的标准型线件规划问题。 

为了便于表达，将 (8.8) 和 (8.9) 式所包含的信息记录在如图 8-1 所 示的箏 纯形表屮。 

X 2 X 5 



图8 -[单纯形表 

该问题的一个明显的基本 Wj 行解是 X = (7,0,0, 12,0, 10) c 

单纯形算法的第1步是选出使目标函数增加的非基本变量作为入基变量。查看单纯形表 
的第1行(也称之为 z 行）中标 有非基 本变量的各列中的值，依次让每一非基本变量从当前值 
开始增加，同时保持其余非基本变量仍为0;然后考察变化结果，看目标函数值是增加还是减 
小了。考察的目的是选出使目标函数增加的非基本变暈作为入基变量。容易看出， z 行中的正 
系数非基本变量都满 足要求 。在上如单纯形表的2行中只有1列为正，即非基本变量 x 3 相应 
的列，其值为3。因此，选取非基本变 M &作为人基变量。 

单纯形算法的第2步是选取离基变量。在单纯形表中考察由第1步选出的人基变童所对 
应的列。在一个萆本变 S 变为负值之前，查看入基变量可以增到多大。如果人基变量所在的列 
与基本变量所在行交叉处的表元素为负数，那么该元素将不受仟何限制,相应的基本变景只会 
越变越大 jfl 果入基变量所在列的所有元素都是负值，则0标函数无界,说明已经得到了问题 
的无 界解。 

如果选出的列中有一个或多个元素为正数，那么就要弄清到底是哪一个数首先限制了人 
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基变量值的增加。 K 然，这一受限的增加量可以用入基变量所在列的元素(称为主元尜）来除 
主元素 所在行的“常数列”(最左边的列）中元素而得到。所得到数值越小说明受到限制越多:, 
闪此,应该选取受到限制最多的基本变量作为离基变量，方 能保证 将入基变暈与离基变餐互调 
位置后，仍满足约束条件、、 

在上曲的例子中，惟一的‘个正值为 z 行兀素3,它所在列中有2个止元素，即4和3、由于 
min j 12/4,10/3 \ = 3,故应该选取为离基变量;入基变量 a : 3 取值为3。 

单纯形算法的第3步足转轴变换 3 转轴变换的 H 的是将入基变歐4离基变5:互调位 置:给 
入基变量一个增值，使之成为基本变量；同时修改离基变量， u ： 入基变 a 所在列中离《变量所 
在行的元素值减为零，并使之成为 f 基本变 is ：。 

对上面的例子，首先解离基变量相应的方程 

x 4 - 2x 2 + 4 ： r 3 = 12 

将人基变量^用离基变量以表示为 

1 1 . 

” _ y X2 + 飞欠 4 = 3 

再将其代入其他基本变量^ 和& 所在的行中消 i 得到 


^6 

代入民标函数得到 


至此，可以形成新单纯形表如图 8-2 所示。 

肀纯形算法的第4步是转回并_重复第1步，进一步改迸目鉍函数值。 

不断重复上述过程，直到 z 行的所有非基本变量系数都变成负值为止、、这表明 H 标函数不 
町能再增加了。 

在上面的箏纯形表中， z 行元素惟一的正值为非基本变量;^相应的列 •其 值为〗/2。因此， 
选取非基本变量^作为入基变量。它所在列中有惟一的正元素5/2,即基本变量^相应行的 
元素。因此，选取 h 为离基变暈。 

再经步骤3的转轴变换得到的新单纯形表如图 8-3 所示。 


2 X 2 + ~^ x 4 + 2^5 




尤 2 


4 


X 4 + 8^5 = 1 


+ *2 ^2 - ^^4 - 



图 8-2 新单纯形表彳 图 8-3 新单纯形表2 

新单纯形表 z 行的所有非基本变量系数都变成负值，因此求解过稈结敗。 

整个问题的解可以从最后••张单纯形表的常数列屮读出 C 在上闹的单纯形表屮可以看到, 
目标函数的最大值为11;最优解为 ; T = (0,4,5,0,0，11)。 
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iHl 颐单纯形算法的计算过程吋以肴 ( li ， 整个过枵町以用单纯形农的形式! J 」 纳为一系列® 
本矩阵运算。主耍运算为转轴变换，该变换类似解线性方程组的高斯消去法中的消元变换 .. 

不妨设当前的中纯形表如图 8-4 所示。 



图 8-4 当前申纯形表 

其中， A ， JC 2 , …，为基本变量； -t m + 1 , x m +2 r ft 1 X n 为非基本变暈。基本变量下标集为 B 二 
|1，2,…， mh 非基木变量下标集为/V = U + l,m + 2,…，当前基本可行解为（/^，心， 
…九 ，0，".，0)。 

单纯形算法计算步骤如下。 

步骤 1 选人基变量。 

如罘所有&备 0 ,则当前基本可行解为最优解，计算结束。否则，取 4 > 0 ,相应的非基本变 
量 h 为人基变量。 

步骤 2 选离基变量。 

对于步骤 1 选出的人基变量、，如果所有 a.^OAi -】， 2 ，".，肌），则最优解无界,计算 
结束。否则，计算 



选取基本变量 M 为离基变量 

新的棊本变量下标集为忑=^ + lei - Uh 新的非基本变量下标集为 W - /V + \ k \ 

- \e \ 0 

步骤3作转轴变换。 

新单纯形表中各元素变换如下： 






a e B y j e ao 


( 8 . 10 ) 


( 8 . 11 ) 


• 238 • 



a 


*7 


a h 

^he 


0, 6 w) 


(l ek - 






^ke 


a e Tv) 


c; : 




( 8 . 12 ) 


(8.13) 


步骤 4 转步骤 1。 

8.1.4 将一般问题转化为约束标准型 

冇几种巧妙的办法可以将一般线性规划问题转化为约束标准璺线性规划 N 题。 

首先,需要把 (8,2) 或 (8.4) 式的不等式约朿转化为等式约束。例如， （8.7) 式中的不等式 
约朿。具体做法足，引入松弛变量，利用松弛变 量的非 负件将不等式转化为等式。松驰变 量记为 
%， 共有+爪 3 个。在求解过程中，应当将松弛变量与原来变 M &同样对待。在求解结束后， 
抛弃松弛变量。 

例如，在引人松弛变貴之后， U 标函数 (S.6) 式未发生变化，而 (8.7) 式变换成如下 形式： 

X[+2x^ + y] = 

2%2 一 714十72 = 0 

Xi ^ X2 + + X4 = ^ 

^2" ^3 + 2^4 - V3 - 1 

注意松弛 变量时 的符号由相应的原不等式的方向所决定。 

为了进一步构造标准型约束 ， 还需要引入爪个人工变量，记为 
例如，在 (8.14) 式的每一等式约电中都引入一个入丄变量，将其变换为 

z ] — x ] + 2 尤 3 + yi = 18 

Z 2 + 2 a ： 2 - 7^4 + >2 = 0 

Zi + X] + + 久 3 + 义 4 =分 
^4 + A" 0 "" X3 + 2^4 ~ yi = 1 

至此，原问题已经变换为等价的约束标准型线性规划问题。 

对极小化线性规划问题，只要将目 k; 函数乘以 - 1即可化为等价的极大化线性规划问题。 

8.1.5 一般线性规划问题的2阶段单纯形算法 

细心的读者可 能已经 发现,除非所有^都是0,否则 (8.14) 与 (8.15) 式并不等价。为了解 
决这个问题，在求解时必须分两个阶段进行。 

第〗阶段用-个辅助目标函数替代原来的目标函数 (8.6 ) 式.即 

Z — ■— Z ] ― 2' 2 — Z ^ 一 Z ^ — — (28 ■— — 4 .T 2 — 2^3 4^^ _ y | — Y 2 + V3 (8.1^) 

其中，后一个等式是将 (8.15) 式代人得到的。 * ^ * 

这个线性规划问题称为原线件规划问题所相应的辅助线性规划问题。现在，对辅助线性规 
划问题用单纯形算法求解。显然，如果原线性规划问题有可行解，则辅助线件规划问题就有最 


(8.14) 


(8.J5) 
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优解， R 其最优值为0,即所有都为0。在辅助线性规划问题最后的单纯形表中，所有^均为 
非某本变量。划掉所有^相应的列，剩下的就是只含^和^的约束标准型线性规划问题。换句 
话说，单纯形算法第1阶段的任务就是构造一个初始基本可行解。 

单纯形算法第2阶段是求解由第1阶段导出的问题。此时要用原来的目标函数进行求解。 
如果在辅助线性规划问题最后的单纯形表中，^不全为0,则原线性规划问题没有可行解，从 
而原线性规划问题无解。 


8.1.6 单纯形算法的描述和实现 


下面讨论一般线性规划问题的2阶段笮纯形算法的实现。我们用一个 C + +类 
earPragrani 来表示解线性规划问题的单纯形算法。 


class LinearProgram ! 
public : 

LinearProgram( ciiar * filename); 
〜 LinearPragratn(); 
void solve(); 
private ： 

ini enter(int objrow); 
int leave(int col); 
int simplex (int objrow); 
int phase!(); 
int phase2(); 
int computet); 

void swapbasic(int row, int col); 


void pivot (int row，int col); 

void stats 0; 

void setba^ic(int 

* basicp); 

void output(); 

int m, 

ml t 

// 约束总数 

// 变量数 

// 不等式约束数（矣） 

m2, 

//等式约束数 

m 3， 

// 不等式约束数（多） 

nl, n2, 

// nl n + m3; n2 

error, 

//记录错误类型 

* basic, 

//基本变量下标 


* nonbasic; // 非基本变量下标 

double ^ minmax ； 


ml; 


其中，主要数据项是存储单纯形表的二维数组 a ， 其存储内容如图心5所示，实际存储的是粗 
线框表示的部分。 







图 8-5 初始单纯形表 


1 . 构造初始单纯形表 

旨先，从标准输入文件中读人数据，构造初始单纯形表。 

• • • % % • • • •〆 • •• •• / • • ^ • • • • 

LifiearProgramr : LinearPrograinl char * filename) 

I 

if strain inFile; 
iiU i ， j; 

double value; 

cout< < " 按照下列格式输人数据: 〃 < < endJ; 

cout< < r, l : +1 (max) 或一 1 (min); m; n tf < < endl ； 
cout < < /; 2 : ml; m2 ； m3" < < endl ； 

cout< <" 约束系数和右端项 " < <endli 
cout< 标函数系数 < < endl< < endl; 
error = 0; 

inFile. open( filename); 

inFilt i > > minmax; 

inFile > > m; 

inFile > > n ； 

// 输人各类约束数 

inFile > > ml; 
inFile> > m2 ； 
inFile > > m3; 

if ( in ! = ml + m3 + m2 ) error = i; 
ril = n + m3? 
n2 = n + m! + m3; 

Make2DArray(a y m + 2，nl + 1); 
basic = new int[ m + 2]; 
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nonbasir = new int[iil + 

// 初始化 s 本变量和非基木变量 

for (i-0;i< - m + 1 ;i + + ) 

for (j = 0;j < = nl ;j + + ) a[i][j] =0.0 ； 
for (j = 0;j < = tiJ ;j + + ) m)nbasic[jj = j; 

// 引人松驰变量和人工变景 

for (i = 1 ♦ j = + 1 ； i < - m; i + + ,j + 十 ) basic!i] - j ； 

for (i= m- m3 + l;i< = m;i+ + + +)1 

a[ij[j] = - I <0; 
aim + 1] [j」=-1 

l 

I 

- // 输人约束系数和右端项 

fyr (i = 1 ； i < " m ； i+ + ) I 

for (j = I ; j < = n;j + + ) i 
inFil^> > value; 
a[i ： Lj- = value; 

} 

inFi!e> > value; 
if (value < 0) error = 1; 
aLi] [0] == value; 

I 

// 输人目标函数系数 

for (j= l;j< = n;j+ + ) ! 
inFile> > value; 
a[0] Lj] - value * minmaxi 

I 

// 引入人工变量，构造第 i 阶段的辅助目标函数 

for (j = 1 jj < ~ n;j + + ) i 

for (i= ml + 1, value = 0,0; i< = m;i + + ) value + = aLilLjJ i 
a[m+ 1 J[jj - value; 

I 

inFile.closeO; 

! 

I 

' ..• ^ • . … - ， - • • • • -- * 

2 . 约束标准型线性规划问题的单纯形算法 

函数 simplex(ohijrow) 根据目标函数系数所在的彳 T objrow ， 执彳 J * 约束标准型线性规划问题 
的单纯形算法。 

• • • • • • 

,, ，- r • a . % • ■ - r- - • ， • • • • • 

int Linear Pro gram： : simplex (int objrow) 

i 

i 

I 

for(int row = 0;; ) i 

int col = eater(objrow); 

if ( col > 0 ) row = ieave(col); 

else return 0; 
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il ( row > 0 ) pivot (row, col); 
else return 2; 


其中，函数 enWUbjrow ) 根据 0 标函数系数所在的行 objmw , 选取入基变量。 


int Lin«irProgram : : enter(int objrow) 


double temp= UBL_ EPSILON ； 

for (int j = 1 , col " 0; j < = nl; j + + )i 

if ( nonbasicfjl < = & & a[ objrow J LjJ > temp ) \ 

col = j; temp - a[objrow] [j]; 


// 


break; 


//Bland 避免循环法则 


return col ； 


函数 leave ( col ) 根据入基变量所在的列 col ， 选取离基变量。 

• • • • • •• % ••••• ••••«• •• • • • •• \ • • • • _•■馨馨 

int LinearProgram :: leave(int col) 

I 

double temp= DBL_ MAX ； 
for (int i = 1 , row = 0; i < = m; i + + ) | 
double val = a[i] [col]; 

if ( val >DBL_ EPSILON ) I 

val = a[ij LOj/val; 
if ( val < temp ) 1 

row = i; temp - vai; 


return row; 


_数 pivot ( row , col ) 以入基变量所在的列 col 和离基变量所在行 row 交叉处兀素 
a [_][ cd ] 为轴心，作转轴变换。 


void LinearProgram :: pivot(int row，int col) 

for (int j - 0; j < = nl ； j + + ) 

if ( j ! = col ) a[rowl. j] = a[row] [jj/a[ row][col]; 
aL row] [col] = 1.0/a[rowl^col]; 
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for (int i = Oi i < - m + 1 i i + + ) 
if ( i ! = row ) < 

for (int j = Ot j < = nl ； j + + ) 
if ( j ! = col ) i 

n[i]\\] - a'i] j] - aLiJL^ol] x 

if ( fabs(a ； i][j])<DBL_ EPSILON) a[i]l jl = ().0; 

I 

I 

aLi. Lcol] = - a[ i * aLrow] [col]; 

I 

I 

swapbaKic( row ， col); 

j 

.,. • • ■ - - - - • % 

函数 swapbaiiic ( row , col ) 交换基本变 M row 和非基本变量 col 的位置:： 

void LinearPrugram: ： swapbasic(int row T int col) 

i 

int lemp= basic[rowl; 
basic[row_ = nonbaftio[colj; 
nonbasic[rol] ~ temp ； 

I 

I 

^ ^ . — • ^ ^ ■ ■ . . ■ ■■_、》«■ 

3. 2 阶段单纯形算法 

函数 computeO 对一般的线性规划问题执行2阶段单纯形算法。 

^ ■ •■ 讎 ■ 4 • • • • ■ ■ • 

^ # r m m m • * m mm ■ _ 馨* *9 9, 着鬱， __ ■讎籲 • • • • • • 

int Linear Prog ram： : compute() 

I 

if ( error > 0 ) return error; 
if ( m ! = ml )1 
error = phasel(); 
if ( error > 0) return error; 

return phase2 ()； 

I 

I 

■ ■ ■ I _ • _ _ _ ■ 

• • • • • ra» • a^iarr^ • • • • • 

其中，构造初始基本可行解的第〗阶段单纯形算法由 phaselO 实现。辅助目标函数存储在数 
组 a 的第 trows 行。 

• ，〆 * * - * - - -- ■■ v. * * • -- - - - * * * • * • • • r '' ■ 

int LinearProgram： : phasel () 

I 

1 

error - simplex(m+ 1); 
if ( error > 0 ) return error; 
for (int i- 1 ;i< = m;i + 十） 
if ( basic[i] > n2 )\ 
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if ( aLUO_ > DBL- EPSILON ) return 3 ； 
for (ifit j = 1 ij < - ; j + + ) 

if ( fabs(a[i][j.)> = DBL_ EPSILON )1 

pivot (i ， j); 
break j 

i 

return 0; 

❿ 

r 

• • • S • • m 

单纯形算法第 2 阶段根据第 1 阶段找到的基本可行解，对原来的 0 标函数用单纯形算法 
求解。原目标函数存储在数组 a 的第 0 行。 

• • * ‘馨 ■藝 

int LiaearProgram : : phase2() 

( 

return simplex(0) ; 

I 

I 

_ 參讎參 • • • • • • _ ■讎 

函数 solveO 是执行 2 阶段单纯形算法的公有函数。 

• • • • • r • ■ ■«/ 馨 • • • • * *• ^ • 參 __«• • % • 

void LinearPrograrn ： : solve() 

t 

cout < < ⑼ dl < < " * * ，线性规划 - 单纯形算法 ** <endJ< < eadl; 

error " vompute(); 
switch (error) | 

case 0: output () ; break; 

case 1 ： cout < < ' 输人数据错误 -< endl; break ； 
case 2 ： cout < 无界解 - < eudl; break; 

case 3 ： cout < <" ■无可行解 - ” < < endi; 

i 

cuuf < <" 计算结束 "< <endl; 

I 

•• • • 产 ■參■籲 馨蜃••馨 • • • • • 

函数 0u i p iit() 输出 2 阶段单纯形算法的计算结果。 

• • iN • • ^ • • • r • •• • • 1 

void lAnearPragram ： ： ouiput() 

l 

I 

int width = 8， * Lasicp; 
double zero = 0.0; 
basicp = new int[ n 十 m + 1 ]; 
setbasir(basicp); 

nout. setf( ios ： : fixed I ios : ：sbowpoint I ios ： : right); 
cout. precision(4); 
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stals{ J; 

unit < < end) < <" 最优值 ：" < < -mimiiax * a 「 t) | 「 0」 < < «ndl< < endl; 
txmi< < ff fil 优解:〃 < < emll < < emll; 
for (irt j - 1 i j < ; m j + + ) i 
coul< < ，、” < <j< < w 

if (basiop[jj ! =0) cout < < setw( width) < < a[ basicpf j l •[() 一； 
else cout< < setw( width) < < zero; 
c out < < endl; 

1 

I 

cout < < endl; 
delete 」 basi(:p; 


8.1.7 退化情形的处理 


用单纯形算法解一般的线性规划问题吋，可能会遇到退化的情形，即在迭代计算的某一步 
中，常数列中的某个元素的值变成0,使得相应的基本变暈取值为0。如果选取退化的基木变 
量为离基变量，则作转轴变换前后的目标函数值不变。在这种情况 F ， 算法不能保证目标函数 
值严格递增，因此可能出现无限循环。 

考察下向的由 Beale 1955年提出的退化 问题的 例子。 


max 



- 20^2 



— 6 AT 4 


S. 



X] - SX2 ~ ^3 + 9X4 ^ 0 

- 12x2 - 4 -” + 3_r 4 在 0 


^3 ^ 1 

xi ^ 0 (i - 1,2, 3,4) 

按照 2 阶段单纯形算法求解该问题将出现义限循环。 

Bknd 提出的用单纯形算法解退化的线性规划问题时，避免循环是一个简单易行的方法。 
Bland 提出在单纯形算法迭代屮，按照下面的两个简单规则來避免循环。 

规则1设 e = minly 丨，取:^为入基变 S 。 

规则2设 A = mini I \ — = mini ^ 11，取&为离基变量。 

L >o J J 

前面的算法 leave(col) 已经按照规则 2 选取离基变量。选取人基变 fi 的算法 enter(objrow) 
中只要增加一个 break 语句即可。参见前面的算法描述。 


8.1.8 应用举例 


1. 仓库租赁问题 

某企业计划为流通的货物租赁若 T 批仓库:要 求:必 须保证在时阀段 i = 1，2,…， n ，^ h 
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的仓厍容量 Kl 用。现有名干仓库源可供选择。设 q 是从时间段 i 到时间段/租用1个单位仓库 
容量的价格，〗矣〜问题是:应如何安排仓库租赁计划才能满足各时间段的佥库需求， 
且使租赁费用最少。 

设租用时间段 t 到时间段 y 的仓库容量为 yi y,l ^ ^ «，则租用仓库的总费用为 

£旮咖 

在时 间段* ■用的仓库#暈$ 

k n 

SEn 

由此可见，仓库租赁问题可 i 述为下面的线性规划 问题： 




n( n + 1)/2 


min^J X ] 

i=l j=i 
k n 

2 心 5? b h (k = 1 ，2, …， n ) 

i= I 尸 A 

}ij ^ 0 ( \ ^ i ^ j ^ n) 


(y]l ^ Y)2^ M ^y\n^Y22jy23y^^y2ny^^yrm) = ( 欠】，太 2 ， “ •，又 m ) 

(c n ， c 12 , … ， c lrt ， c 22 , … ， c 23 ， … ， c 2n ，…， 〜„) = {d { ,d 2 ,'^ ,d m ) 

上述线性规划问题可表述为 n 个约束和 m 个变量的标准型线性规划问题 

m\nd T x 


s.t• Ax ^ b 



x ^ 

1 … 1 1 0 0 … 0 0 0 … 0 


其中，4 


0 1 …1 1 

0 0 1 …1 

_ « « t 9 

::: ■■: 

■ 0 0 … 0 1 


t 1 … 1 

0 1 … 1 



0 … 0 1 


0 

» 41 钃 _ 

# _ A 蠢 

♦ « # P 

0 0 0 0 

0 … 0 1 - 


下面的算法从给定的仓库租赁问题输入构造矩阵4和相应的线性规划问题的输入参数, 


从而可用前面讨论的单纯形算法求解。 


void input(char 、 filename,char ^ file) 

•• 

f 

ifjitream iiiKile; 
ofstream out File; 
int * b, ^ c% * « d; 

int i ， j ， k ， p ， q ， n ， m; 
inFile. open (filename); 
inFile> > n; 
m - n * (n + 1 )/2; 
b = new int [n] i 
c = new int L m 」； 

Make2DArray(d, n, m); 
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for( i-0;i<n;i+ + ) in File > > b[ i j; 
for( i = 0，k = 0;i<n;i+ + ) 
for(j = 0;j < n - i;j + + ) 
inFile> > eLk + + ^; 
inFile^dose(); 

for(i = 0;i < a;i+ 十 ) 

for(j = 0;j < m;j + + ) ilfji =0 ； 
for(k^=0;k< n;k + + ) | 

p=n-k;q = k*n-k* (k- 1 )/2; 
for(i = 0;i< p ； i+ + ) 
foT(j = i ； j< p ； j+ + ) 

d[i+kl[ q +jj = l; 

I 

outFDe^ open (file); 

out File < < 一 i < < 〃 〃 < < n < < " w < < rn < < endl; 

ocitFile < < 0 < < M ”<<()<<” n <<n<< endl; 
for(i = 0; i < ri; i + + ) \ 

for(j = 0;j < m;j + 十） 

out File < < d[i] [j] < <” ”； 

outFlle< < b[i] < < ^ndl^ 

I 

for(i - 0 ； i < ni; i + + ) out File < < c[i] < < " 
oatFile< < endl; 
outFile.close(); 
delete [ ]b; delete L Jc; 

Dele te2 D A rray (d ， n); 


8.2 最大网络流问题 

8.2.1 网络与流 

1 . 基本概念和术语 

先介绍与网络流有关的一些基本概念3 

(1) 网络 

设 C 是一个简单有向图， G = ( V , E ), V = _!1，2,…， ni: 在V中指定一个顶点^称为 
源; 指定另一个顶点“称为汇。对于有向图^的每一条边瓦，对应冇一个值 capU， 
iv ) 身 0,称它为边的容童。通常把这样的有向图 C 称为一个网络。 

(2) 网络流 

网络上的流是定义在网络的边集合上的一个非负函数 flow = Iflcm 、 （心 并称 
flow ( V t w) 为边(圯， ) 上的流量。 

(3) 可行流 
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满足下述条件的流 flow 称为可 行流： 

① 容量约束对每 一 条边 U、 ， w ) G 尺，0矣 flow( v , w ) ^ cap( V , w ) c . 

② 平衡约柬对于中间顶点，流出# =流入量。即对每个〃 €以 t: / h 0有 


即 


对于源^ 


即 

对于汇^ 


顶点I；的流出量-顶点 u 的流入量= 0 

〉 ] flow( r , w ) - X flow( w ^ v ) = 0 

{x 7 iv)G ^ ( mt, i*j6-r 


的流出量 -s 的流入量 = 源的净输出量 / 


2 How(,S > , V ) 
, v)(= F 


2 fl«w( V 

(r. i ) 6 E 


t 的流人量 -/ 的流出量 = 汇的净输人量/ 

即 y^j flow( V ,t) - 2 flow( t^v) = / 

{v,i)€ F (i,i)e£ 

式中， / 称为这个可行流的流量，即源的净输出量(或汇的净输入量 k 

吋行流总足存在的。例如，让所有边的流董 flowU，!^) =0,就得到一个流量/= 0的可行 

流(称为0流 h 

(4) 边流 

对于网络6、的一个给定的可行流 flow， 将网络中满足 flow( v , w ) - cap( v , w ) 的边称为 
饱和边;称 flow( pw ) < cap( v , w ) 的边为非饱和边;称 flow( t; ， wO = 0 的边为零流边;称 
flow( v , w ) > 0的边为非零流边。当边 （f，w ) 既不是一条零流边也不是 一 条饱和边时，称为 
弱流边。 


(5) 最大流 

最大流问题即求网络 C 的一个町行流 flow， 使其流量/达到最大。即 How 满足 

0 ^ flow (i； t w ) ^ eap( v y w ) ^(v y w ) £ E 


且 flaw( V y W )-y] fiow( w,v) 

(6) 流的费用 



在实际应用中，与网络流有关的问题不仅涉及流量，而 fl 还有费用因素。此时，网络的每一 
条边 （ v ， w ) 除了给定容量 C ap( 外,还定义了一个单位流量费用 ⑶ st( ^ O。 对 T 网络中 

一个给定的流 flow， 其费用定义为 


cost ( ilow ) = 2 v t w ) x flow ( v , iv ) 

u_ ， ) e £ 

(7) 残流网络 

对于给定的一个网络 C 及其上的一个流 flow , 网络 G 关于流 flow 的残流网络与 G 有 
相同的顶点集 F ， 而网络 C 中的每一条边对应于中的1条边或两条 边:设 U , w ) 是 G 的 
一 条边。当 flow ( v , w ) > 0时 ，（ w , u ) 是屮的 一 条边，该边的容量为 cap _ ( «; ， I 1 ) = 
flow ( w ) ;当 flow ( v , w ) < cap ( t 1 ， w ) 时 ， （rw ) 是中的一条边，该边的容量为 

cap * ( 幻， u ?) = cap ( v ，从)一 flaw ( v , w) c 

按照残流网络的定义，当原网络 G 中的边 （ r ， w ) 是一条零流边时，残流网络中有惟 
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一的 一 条边 （ V , w ) 与之对应，且该边的容里为 cap ( rw ) c 当原网络 C 中的边 （ y ， W ) 是 一 条 
饱和边时，残流网络中有惟一的一条边 U , tO 与之对应,该边的容量为当原 
网络 G 中的边 （ V ，《； ) 是一条弱流边时，残流网络 G 中有两条边 （ v , w ) mw . v ) 与之对应, 
这两条边的容量分别为 cap ( v , w ) - flow ( v , it ，） 和 flow ( v , w)o 
残流网络是设计与网络流有关算法的重要工具. 

2. 流网络数据结构 


以下用类 EDGE 表示网络中的边。 


claas EDGE 


int pv, pw, pcap, pcost, pflow; 
public : 

EDGE(int v, int int cap^ int cost) : 

pv(v), pw(w), pea〆cap) ， pcosl(co$t)i pflow(O) | ! 
int v() const i return pv;) 
int w( ) const | return pw;; 
int cap() const | return pcap ； I 
m\ cost () const | return pcost;[ 

int wt(int v) const I return from(v) ? - pcost : pcost; \ 
int flow() const \ return pflow; I 
bool from (int v) const 


return pv = = v; 

I 

bool residual( int v) const 


return (pv =■ = v & & pcap - pflow >011 pw - - v & & pflow > 0 ); 

J 

int otW(irit v) const 


return frotn(v) ? pw : pv; 

i 

int capRto(int v) const 

i 

return from(v) ? pflow : pcap - pflow; 

I 

i 

int uostHto(i«t v) const 


return from(v) ? - pcost : pcost; 

t 

void addflowRto(int v, int d) 
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pflow + - frorn(v) ? 一 d :山 


其中，私有成员 pv 和 pw 分别表示边的起点和终点; pcap ， pwst 和 pflow 分别表示边的容量、 
费用和流量。 

类 EDGE 的大部分公有成员是简单自明的，有些在用到时再进一步解释。 

函数 from 和 other 与有向边的方向有关。如果 e 是指向一条边的指针 .e - > from ( iO 返 
回 Irue 时， t 是边 e 的起点 ; e - > other ( v )则返回边 e 的不同于 t *、 的另 一 个端点 
函数 residual , capKto , costRto , addflowRto 与残流网络有关。 

函数 residnaKd 用于判断残流网络中是否有一条以 r 为起点的边。 

函数 capRto 给出残流网络中边的容量。如果 e 是指向边 U ， uO 的指针^的容量为 c ,流 
量为/,则按残流网络的定义 e _ > capRlo ( w ;) 是 c _ /,而 e - > capRto ( !；)是八 

函数 cosmto 给出残流网络中边的费用。如果边 e 的费用是 cost , 则按残流网络的定义 

e - > costRto ( 是 cosU 而 e - > capKto ( u ) 是一 cost 。 

函数 addflow Rto 改变残流网络中边的流量。如果 e 是指向边 （ tJ ， w )的指针， e 的流量为 
/*，则 e — > addflow Rto ( w , d ) 将 e 的流量改变为 f + (/， 而 e - > addflow Rto ( t 1 , rf ) 将 e 的流量 
改变为 /- 心 

下面用类 GRAPH 表示一般的网络。 


template < dass Edge> class GR APH 


ini Vent, Ecnt; bool digraph; 
vector< vector < Edge * > > adj; 
public : 

GHA PH(inl V, bool digraph = false) : 

adj( V + l), Vcnt( V + i) ♦ Ecnt(O) , digraph (digraph) 

I 

for (mt i - Oi \ < = V; i+ + ) 
adj[i]. assign{ V + 1, 0); 

I 

GRAPH() i 、 


int V() const 1 return Vent; \ 
int K() const i return Ecnt; i 
bool direc ： ted{) const \ return digraph; ! 
void insert (Edge ^ <?) 

I 

i 

int v = e - > v( ) F w = e- > w()j 
if (adjLv]l. w] 二 = 0) Ecnt + + ; 

adj[v][ w] = e; 
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if ( ! digraph) adj[w 」 |_v] = e; 


void mnove( Edge ^ e) 

I 

參 

intv : c- > v( ), w = e- > w(); 

if (adj[v]Lw] ! = 0) Ecnt ——； 

adj[vJLw] - 0; 

if (! digraph) adj[wJi.v] = 0 ； 

I 

f 

Kdge * edge(int v, int w) const 

j 

return adj[ v] [ wj ; 

I 

void read (char * filename^int & s ， int& t, int &se，int & te) 

r 

1 

int i ， j, n ， ni ， mnax ， cap T cost; 
ifstream inFiie; 
inFile.op)eii( filename); 

inFile> > n > > m > > s > > se> > t > > te> > amax; 
for (int k-0;k<m;k + +)| 

inFile > > i > > j > > cap > > <;ap > > cost; 
if (cap> 0) insert( new KDGE(i, j, cap, cost)); 

I 

? 

insert (new ED(;E(iiirmx + 1 ,0 ， se ， 0 )); 

s - nmax 十 1 ? 

inFile. close(); 

I 

r 

void checksd(int s,inl itit int &dd) 

I 

= 0 ； dd^0 ； 

for (int i= 0;i< Vcnl;i+ + }\ 

if (adjtsjfij && adj[s][i] - > from(^) & &■ adj[s'Li] - > flow() > 0 ) 

ss+ = adj[s][i] - > flow(); 

if (adjiij[t] & & adj[i][l] - > from(i) & & adj[ iJ L t] - > flow( ) > 0 ) 

<1(1+ =adj[i]Lt」-> flow(); 


上述结构用图的邻接矩阵表示一般网络，其私有成员 Vent 和 Kent 分别表示网络中的顶 
点数和边数; adj 是邻接矩阵; digraph 是有向图标志^ 

类 GRAPH 的大部分公有成员是简单自明的，有些在用到时再进一步解释。 

网络的搜索游标功能是有序地搜索网络中与某个顶点相关联的各条边，我们将其定义为 
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一 个特殊的类 adjllerator 0 


template < Kilge > 
class adjlterator 

f 

const GRAPH < Edge> &G; 



public ： 

adjlteraior(const GRAPH < Edge 〉 &G, int v) : G(G), v(v), i(0), j(0) \ 
Edge * beg() 

I 

i = - I; j = - 1 ; return nxt(); 

Kdjre ^ nxt() 

I 

for (i 十 + ; i < G. V() ; i + + ) 

if ( G♦ edge( v T i)) return 0.edge( v, i); 
for (j+ + ； j < G, V(); j 十 + ) 

if (G-edgt^j, v)) return G.edge(j, v); 
return (); 

I 

bool end( ) const 

I 

return (i > = G. V() & & j > - G, V()); 


其中， beg () 是搜索的起 始边; tixt ( )是 下一条要搜索 的边; eml () 尜示搜索结束。 

8.2.2 增广路算法 

1 . 算法基本思想 

设 P 是网络 G 中联结源 a 和汇£的一条路。定义路的方向是从5到^可以将路 P 上的 
边分成2 类:一 类边的方向与路的方向一致，称为向前边，其全体记为 P + ;另一类边的方向与 
路的方向相反，称为向后边，其仝体记为户_。 

设 flow 是一个可行流， P 是从 s 到£的一条路，若尸满足下列 条件： 

⑴在 P 的所有向前边 U ， W ) 上， flowU ， w ) < ca p u , wO , 即 P + 中的每一条边都是非 
饱 和边； 

⑵在 P 的所有向后边 （ v ， mO 上， flow ( t ；， w )>0 ，SP 中的每一条边都是非零流边； 

则称 P 为关于可行流 flow 的一条可增广路。 

可增广路是残流网络中一条容量大于0的路。 

将具有上述特征的路 P 称为可增广路，是因为可以通过修止路 P 上所有边流量 flowU ， 
切），将当前可行流改进成一个流值更大的可行流。 
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具体做 法是： 

(1) 使不属于可增广路 P 的边 （ r ， w ;) 上的流暈保持不变。 

(2) 可增广路 P 上的所有边 U , w ) 上的流量按下述规则 变化： 

•在向前边 (u , w ) 上 ， flo W ( V， w ) + d 0 

• 在向后边 （p ， wO 上， flow ( v y w ) - dc 
也就是按下面的公式修改当前 的流： 

flow ( V , w) ->T d ( l f w )^： P + 
flow ( t ， ， w ) = < flovv ( v , w ) - d {v t w )^ P ~ 

L flow ( V , w) ( V , w )^； P 

其中， d 称为可增广量。它按下述原则确定 M 取得尽量大，使变化后的流仍为可 行流。 不难 
看出，按照这个 原则川 既不能超过每条向前边 U 的 cap ( f ， R ，）- fk > w ( t_ ， W ) ，也不能超 
过每条向后边 （ V ，切）的 flow ( V ， w),、, 因此 d 应该等于向前边上的 cap ( v 9 w) - flow ( v ,w)H 
向后边上的 flowU ，《;) 的最小值，也就是残流网络中 Z 5 的最大容量。 

增广路定理 设 fbw 是网络 C 的一个可行流，如杲不存在从 s 到/关于 fimv 的可增广路 
/>，则 flow 是 （； 的一个最大流。 

2. 算法描述 


根据前面的讨论，可设计求最大流的增广路算法如下^该算法也常称为 Ford Fulkerson 
算法。 

■ _ _ • ^ • •• ••• • • % % % 

• 、 W __ 馨 __j ■，讎 _ r ,_ r • • • _鑛 • • • 

template < Graph，class Edge> class MAXFLOW 

I 

I 

const Graph &G; 
int 8 ， t ， maxf; 
vector< int > wt ； 
vector < Edge * > st; 

int ST(int v) const \ return st[v] - > othpr(v); i 
void augment(int s, int t ) 

I 

int d = st[t] - > capRto(t); 
for (int v = ST(t); v ! = s ; ， 
if (st[ v] - >oapRto(v) < d) 
st[t] - > addflowRto(t t d); 
maxf + = d; 

for ( v = ST(t); v ! = s; v = ST( v)) 
st[v] - > addflowKto(v t d); 


=ST(v)) 

d = 丸 vl- > capRto( v); 


bod pfs(); 
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MAXFLOW(cutt^l Graph &(;，ini inL t，int &maxflo\v) : 

G(G), s(s), t(t), st(G.V()), wt(G.V()),maxf(0) 


while (pfs( ) ) augment(s T t); 
maxflow + = maxf; 


上面描述的是一个适用于一大类算法的广义的算法框架。算法的苯本思想是，用一个 
PFS (优先级优先搜索， Priority First Search ) 搜索算法找到网络屮的一条从 s 到 f 的坷增广路， 
然后沿此吋增广路增流，直到网络中找不到可增广路时为止。 

算法中用向量 M 来存储搜索到的网络支撑树，用 S t 、] 存储指叫树边 e 的指针， e 是 
连接 p 和1_的父结点的边。函数 ST [ t ，] 返冋支撑树中 V 的父结点。 

算法 augmentUsO 首先沿 st 给出的可增广路汁算可增广量 心然后 再沿叮增广路增流、 
整个算法的关键和难点是如何寻找关于当前可行流的可増广路，特别迠当网络屮顶点数 
和边数较多时，寻找可增广路的算法 pfs 的效率至关重要。 


template < class Graph , class Edge > 
bool MAXFLOW < Graph ， Edge> :: pfs() 

I 

4 

I 

PQ < int > pQ(G* V(), wO; 

for (int v = 0; v < G. V(); v + + ) 

1 wt[v] = 0; st[v] * 0; pQ^ insert (v); 
wt[s] = M; pQ.changes )； 
while ( ! pQ. emptyO ) 


int v = pQ .deletemax(); wt[v] = M; 

if 〈V = = t U (v ! = s & & st[v] = = 0)) break; 

adjherator < Edge > A(G, v); 

for (Edge * e = A.begO; ! A. end(); e = A. «xt()) 

! 

int w = e- > other(v); 

int cap " e- > capRto(w ); 

int P = cap < nt[v] ? cap : wt[v]; 

if (cap > 0 & & P > wt[ w]) 

i wt L w] - P; pQ.change(w); at[w] = e; f 


return atLtj ! = 0; 


上面描述的算法 P f s 实际上是一个适用于寻找可增广路的算法框架。算法屮用一个优宄 

队列 P Q 记录搜索优先级。按搜索优先级依次搜索网络的各条边，直至找到一条4增广路。 
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不同的优先级将导致不同的搜索效果。例如，上而的算法 pfs 中将优先级定义为残流网络屮 
边的容暈。相应的算法也祢为最大 W 量增广路算法 u 如果用最短路长作为优先级，则算法中 
的优先队列就是一个齊通队列。此时的优先级搜索就是广度优先搜索， y 此相应的增广路算 
法称为最短增广路算法 c 

算法屮的 M 是网络最大边荇量的一个上界。向暈 WI 用 T 记录搜索顶点的优先级。优先 
队列类 PQ 可用堆实现。 

% % • • • • 

• • • • ^ j • • j • • • • 

template < class key Type > class PQ 


int d, N} 

vector < int > pq ， qp ； 
const vectui < key Type > &aj 
void texoh(int i, int j) 

I 

1 

int t = pqLi]; pqLiJ - pq[j]; pq[j] = U 

qp[pqjjj = i ； qp[pq[j]] = j ； 
f 

void £ixUp(int k) 

s 

while (k > 1 & & a[pq[(k + d-2)/d」< a[pq[ k_ ]) 

! 

I 

exch(k, (k + d-2)/d); k = (k+d-2 )/ 山 

I 

I 

I 

I 

void fixDown(int k, int N) 

I 

int j; 

while ((j = d* (k - 1) + 2) < = N) 

for (inti = j+ li i < j + d&&i < = N; i + + ) 
if (a[pqLjjj < a[pq[i]]) j = 

if (! (a[pq[k]j < a[pqLj].)) break; 
exch(k, j); k = j; 

} 

l 

I 

public : 

PQ(int N y vector < key Type > int d = 3) ： 
a(a), pq( N + 1 ， 0) T qp(N + 1, 0), N(0) , d(d) ) i 
int empty() const \ return IS = = 0; I 

void insert (int v) I pq[ + + N] = v; qp[v] = 、； £i\Up(N )； ! 

int deletemaxO | exch(l, N); fixDy\vn( 1 5 N - 1 )； return pq.N - ]； t 

void change(int k) ) fixllp(qp.k]); I 
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3. 算法的计算复杂性 

容易看出，增广路算法的效率由下面两个 H 素所 确定： 

(1) 整个算法找可增广路的次数。 

( 2 ) 每次找可增广路所需的时间： 

由此可见，求网络最大流的增广路算法的效率主要由算法…确定。而外算汰的效率义 
与优先队列的选择密切相关。当优先队列以最大容量为优 先级时 ，得到最大容暈增广路算法。 
当优先队列以最短路为优先级时，得到最短增广路算法。 

如果给定的网络中有 a 个顶点和 m 条边，且每条边的容量不超过於、可以证明,在一般 
情况 F， 增广路算法中找可增广路的次数不超过 nM 次。 

对于最短增广路算法，在最坏情况下，找可增广路的次数不超过次找1次 nT 增广 
路最多耑要 0(m)i| •算时间。因此，在最坏情况下，最短增广路算法所需的计算时间为 
OUm 2 )。 当给定的网络是稀疏网络时，即 OU) 吋，最短增广路算法所需的计算时间为 

0( rt 3 ),) 

对于最大容量增广路算法，在最坏情况 K， 找4增广路的次数 不超过 2mhgM 次，由尸 
使用堆来存储优先队列，找1次增广路最多笛要 0(«bg «) 计算时闪此，在最炻情 况卜, 
最大容量增广路算法所需的计算时间为当给定的网络是稀疏网络时，最 
大容 M 增广路算法所需的计算时间为 OUigMogiW)。 


8.2.3 预流推进算法 


1 . 算法基本思想 

增广路算法的特点是找到可增广路后，立即沿可增广路对网络流进行增广3每一?欠增广 
可能需要对最多1条边进行操作。因此，在最坏情况下，每一次增广需要 0 U ) 计算时间/ 
在有些情况下，这个代价是很高的。下面是一个极端的例子。 

在图 8-6 所示的网络中，; s = l , 丨=20。边 （1,2), (2, 3), …， （8 ，9)上的容量为10,其他边 
(顶点9的出边和顶点20的入边）的容量均为1。无论用哪种增广路算法，都会找到10条增 
广路，每条路长为10,容量为1。因此，总共需要 K ) 次增广，每次增广需要对10条边进行操 
作，每条边增广1个单位流量 D 然而，注意到这10条增广路中的前9个顶点（前8条边)足完 
全一样的。如果直接将前8条边的流量增广〗0 个单位 ，而只对后面 K : 为2的不同的有向路单 
独操作，就可以节省许多计算时问。这就是预流推进 (prehw push ) 算法的基本思想:；也就 
是说，预流推进算法注重对每一条边的增流，而不必每次一定对-条增广路增流。通常将沿一 
条边增流的运算称为一次推进 ( push ) 。 

在算法的推进过程中，网络流满足容暈约束，倂一般不满足流暈平衡约束。此外，从每个 
顶点 U 和 f 除外）流出的流量之和总是小于等于流人该顶点的流跫之和：这种流称为预流 
( p reflu W ) ，这也是这类算法被称为预流推进算法的原因。下面先给出预流的严格定义。 

给定网络（； = (〖/，€)，一个预流是定义在^的边集 A ’ h 的一个正边流函数 r 该函数满 
足容量 约朿， 即对 G 的每 一 条边 （v , w )^: E ，满足0备 flow ( I : , H ； ) ^ cdp ( V . U ))^ 

对 C 的每-中间顶点满足：流出量小于或等于流人量。即对每个 k’u ^，0 有 

flow( t 1 , tt') ^ X/ flow( w} 

(r, tt.)6 E ( w > r)^r E 
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满足条件 


图 8-6 说明增广路算法的例子 


flOw( V y w) 

{?，♦«)£ F 

的中间顶点 r 称为活顶点 。量 




riow( w , v ) 




/ t flow( W 3 v) - fl(>w( V , w) 

(U. , f ) 6 /•- ( ?' , ti ) C ^ 

称为顶点 r 的存流。按此定义，源 $ 和汇 i 不可能成为活顶点。 

对网络 G 上的一个预流，如果存在活顶点，则说明该预流不是可行流。预流推进算法就是 
要选择活顶点，并通过把一定的流量推进到它的邻点，尽可能地将当前活顶点处正的存流减少 
为0,直至网络中不再有活顶点，从而使预流成为可行流。如果当前活顶点有多个邻点，那么首 
先推迸到哪个邻点呢?由于算法最后的 S 的是尽可能将流推进到汇点因此算法应寻求把流 
1推进到它的邻点中距顶点 f 最近的顶点。预流推迸算法中用到一个高度函数 /l 来确定推 
流边。 

对于给定网络 G = (F， 五）的一个流，其高度函数/I是定义在(；的顶点集 K 上的一个非 
负函数。该函数 满足： 

0) 对于 C 的残流网络中的每一条边 U，〃）, 有 AU〉S h ( v ) + lo 


(2) h ( t ) = Oc 

G 的残流网络中满足 M a) = h ( v ) + i 的边 U,〃） 称为 （； 的可推流边。 

下面的函数 hdghus() 以每个顶点在残流网络中到汇点£的最短路长作为其高度函数值来 
构造一个有效的高度函数 C 


void heights() 

I 

QUEUE<int> queue(G.V())i 

for (ini i = 0; l < G, V()i i + + ) li[i, = 0; 

queue, put (t); 

// 广度优先搜索 

while ( \ queue.empty()) 
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ini \ = queue, gei (); 

// 搜索与顶点、 相 连的边 

adjiterator < Kdge > A( G, v); 

for (Edgf?*^ c = A^be〆 ）； ！ A.end() j e =： A. nxt( )) 

\ 

int w 二 c- > othcr( v); 

if ( h[ wl = = U & & e- > residual(w)) 

i hL w_ = h[ V J + 1 i queue, put( w) ; 

I 

I 


下向 给出一 般的预流推进算法的基本框 架:一 般的预流推进算法。 

• 、 - • • • • 

步揉 0 构造初始预流 flow 。 对源顶点 sS 的每条出边 （ s ， I' ), 令 flow(s ♦ ；,■) = cap( .s , i,_) ; 对 K 余边 （ w 、 r ) . 
令 flowU，d = 0 。 构造一个有效的高度函数 A 。 

步骤1 如果残流 网络中 不存在活顶点，则计算结束 ，已经 得到最 大流 ; 否则，转步骤 2-, 

步骤 2 在网络中选取活顶点 ^ 如果存在顶点 1 ；的出边为可推流边 , 则选取一条这样的可推流边，并 
沿此边推流。否则，令 AU) = minj AU) + 11 (t; ， m) 是当前残流网络中的边 L 并转步骤 k 

_>• • • • • • 參禱籲 _ • • 

一般的预流推进算法的每次迭代是一次推进运算或.-次高度重新标^运算。对于推进运 
算,如果推进的流量等于推流边 h 的残留容量，则称为饱和 推进; 否则称为非饱和推进。 

算法终止时，网络中不含有活顶点。此时只有顶点 .9 和/的存流曾非零 。 所以，此时的预 
流实际上已经是一个可行流 。 又由于在算法预处理阶段已经令 72, 而高度函数在计算 
过程中不会减少，因此算法 在讣算 过程中可以保证网络中不存在可增广路。报据增广路定珂, 
算法终止时的可行流是一个最大流。 

一般的预流推进算法并未给出如何选择活顶点和可推流边。不同的选择策略导致不同的 
预流推进算法。在基于顶点的预流推进算法中，选定一个活顶点后，算法沿该活顶点的所有推 
流边进行推流运算，直至无吋推流边或该顶点的存流量变成0时为止。 

2. 算法描述 

基于顶点的预流推进算法可描述 如下： 

I ^ ^ • • • • I 參 — A 

template < class Graph, class Edge > class M AXFLOW 

j 

const Graph &G; 
ini s, ti 

vector <int> h，wU st; 

PQ<int> gQ; 


pu blic ： 
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M AXFI,QW( Graph & G, irit s, int t，irit max flow) : 

G(G) ， sU) ， t ⑴， h(G.V(),0), wt(G.V(), 0), st(G.V(), 0), 

i 

heiglit ^(); 

wtmaxl); 

.pul(s) j sl[sj = lj 

while (! gQ.emptyO) 

i 

int v = gQ.getO ; 
stLv] - 0; 

v); 

relabel( v ); 

i 

maxflow + = wtLtj; 


算法中用一个广义队列 gQ 存储当前活顶点集合。向量 st 是活顶点标志, si [ v ] = 1表示 
顶点 V 是活顶点。向量 Wt 用于存储当前活顶点的存流量。 

函数 height ) 初始化高度函数。 

函数 wtmax () 对源顶点 ， 计算 wt [ s ] = ^ oap ( s ， v ) 



void wtmax () 

I 

I 

adjlteralor < Edge> A(G y s); 

for (Edge * e = A.begO; ! A^endO; e = A.nxlO) 
if (e- > from(s))wifs] + = e- > cap(); 


函数 push ( e ，\， w ， f ) 对可推流边 （〃 ， w ) 推进流量 / 

•• •• ••••••• ••••• 

void push(Edge * e,int v,int w,int f) 

e- > «ddflowKto( w $ f); 

Wl^V 」 一 =f; wt[ w] + = f; 


函数 dischargeU ) 对活顶点 y 执行基于顶点的预流推进运算。 

• • j j • • 

void tlis<Jiarge(inL v) 

adjlLerator < tdge> A(G, v) j 

for (Edge ^ e = A. beg(); ! A.end(); e = A.nxtO) i 
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int 的 =e - > oth^r(v); 
mt - e - > capRto( w); 
int P = cap < wl[v] ? cap : w\[ \ ]; 
if ( P > 0 & & (v = = s / I fii_v 」 - =h L w J + 1))1 
push(c,v % w,P); 

if* ((w ! = s) & & (w ! = t) && (l stf w])) 

1 gQ.put( w) ; st[wj = 1 ;: 


函数 rdabeiu ) 对活顶点〃执行卨度東新标号运算。 

• 丨 • r • ^ • • 

void relabel(int v) 

( 

if (v ! = s & & v ! = t & & wt[v] > 0) 

int hv = !NT_MAX; 

adjIterator< Edge> A(G, v); 

for (Edge * e = A.begO; ! 4.end(); e = A, nxL()) i 
int w = e- > other(v); 

if ( e- > residual(v) & & h[ wj < hv) hv = h[ w]; 

I 

if ( hv < INT.MAX ) h ； v] = hv+ 1 ； 

^Q.put(v) ； st[vj = 1; 


3. 算法的计算复杂性 

上面的基于顶点的预流推进箅法用一个广义队列 gQ 存储.当前活顶点集合，这个广义队 
列可以是通常的 FIFO 队列、 LIFO 栈、随机化队列、随机化栈，或按各种优先级定义的优先队 
列。由此可见，上的基于顶点的预流推进算法实际 I ：包括了一大类算法。因此，算法的效率 
与广义优先队列的选择密切相关。 

如果选用通常的 FIFO 队列，则在最坏情况下，预流推进算法求最大流所需的计算时间为 
0( mn 2 ) ，其中和 a 分別为图 G 的边数和顶点数。 

如果以顶点高度值为优先级，选用优先队列实现预流推进算法，则在最坏情况下，求最大 
流所需的计算吋间为 0 W 这个算法也称为最高顶点标号预流推进算法 

近来已提出许多其他预流推迸算法的实现策略，在最坏情况下，算法所需的计算时间已接 

近 0( 訓 ）0 
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8.2.4 最大流问题的变换与应用 

1 . — 般网络的最大流问题 

在一般情况下，网络可能有多个源和多个汇。此时，可将一般网络的最大流问题转换为与 
之等价的申源单汇网络的最大流问题。 ii 体做法是: 在原网 络的基础上，增加-•个虚源 s 和一 
个虚汇 r 如果原网络有 p 个源…，&和 v 个汇，…，％,则在原网络中增加 p 条以 
5为起点的边(^，^)， U ，^ 2 ), …以及 g 条以 t 为终点的边 （Q， 0, ( 【2, ^)，…，（~“）。 
新增各边的容 M 分别定义为®点&，&，•_•，&的流出量和顶点…，~的流入量。新网络 
的最大流对应于原网络的最大流： 

2 . 可行流问题 

在有多个源点和多个汇点的网络屮，给每个源点一个正的流量，给每个汇点一个负的流 
量，且所冇源点和所有汇点流量的代数和为零。可行流问题要求判断对于给定的多源和多汇 
网络是否存在满足源点和汇点流暈约束的紂行流。可行流问题实际上是前面所说的一般网络 
的最大流问题，容易转换为如下标准的最大流问题。 


template < class Graph, class Edge> class FEASIBLE 

I 

const Graph &G ； 
public: 

FEASIBLE (const Graph &G, vector < int> sd) : G(C) 

I 

int maxflow,ss, dd, supply, demand; 

Graph F(G.V() + 2,1); 

for (int v = 0; v < G. V(); v + + ) 

I 

I 

adjIterator< Edge> A(G ， v )； 

for (Edge * e = A.begOi ! A.end(); e = A.nxlO) 
F. insert (e); 

i 

! 

int ft = G.V(), t = G. V() + 1; 

supply = 0; demand = 0; 

for (int i = 0; i < G. V( ); i + + ) 

if (adLiJ > - 0)i 

supply + = sdri]; 

F.insert(new EDGK(s, i, sd[i])); 

I 

else! • 

demand - ^ sdLi ]； 

r,inserl(new EDGE(i, t, - ad[i])); 
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MAX FLOW < Graph, Wge>(t 、， s, t, maxflow); 




F.chetkscKs, t,ss,dd); 

if (supply = = ss) cou t <〈"supply ok" < < encil; 

else rmit < < ” supply not encnigh” < < endl; 

if(demand = = fM) cout < < ''demand met" < < endl; 

cout < < "demand not met" < < endl; 

F. outflow ()； 


其 中涵数 如如心，133，州用于计算源点 s 的总流出量 ss 和汇点 t 的总流入量 tl。 

• • . • - • 

void checked(irit s, int t, itit &ss, int &dd) 

•• 

ss = 0;dd = 0; 

for (int i = 0; i < Vent; i + + ) 

I 

B 

I 

if (adj|.sj [ij & & adj L s] [ij - > from(s) & & adj[s] [i w - > flow() > 0 ) 

8S+ = atij[s][ij - > flo ^()； 

if (adjLijLt] && adj^iJLtJ - > from(i) & & adj[i ]： - > flow( ) > 0 ) 
dtl+ - adj[ij[t] - > flyw(); 


3. 网络的顶点容置约束 

在有顷点容量约束的网络最大流问题中，除了需要满足边容量约束外，在网络的某些顶点 
处还要满足顶点容量约束，即流经该顶点的流量不能超过给定的约束值。这类问题很容易转 
换为标准的最大流问题。只要将有顶点容量约束的顶点 u .用一条边 U，〃） 来替换，原来顶点 
认 的入边仍为顶点《的入边，原来顶点“的出边改为顶点的出边。连接顶点 u 和顶点 p 只 
有一条边 U，W， 其边容量为原顶点“的顶点容量。容易看出，变换后网络的最大流就是职 
网络中满足顶点约束的最大流。 


4. 二分图的最大匹配问题 


设 C =( 匕幻是一个无向图。如果顶点集合 F 可分割为两个互不相交的子集 J 和 L 
并且图中每条边 U，y) 所关联的两个顶点纟和 j 分属于这两个 小冋的 顶点集，则称图 c 为一个 
二分图。 

图匹配问题可描述如下:设 C = ( F，^) 是一个图。如果於£1且“中任何两条边都 

不与同一个顶点相关联，则称 M 是 （； 的一个匹配。 C 的边数最多的匹配称为 C 的最大（基 
数)匹配。 

二分图的最大匹配问题就是在已知图 e 是一个二分图的前提下，求的最大卯 配。 

给定一个二分图 G 和将图 G 的顶点集合 K 分成互不相交的两部分的顶点了集尤和 K， 
如下构造与之相应的网络 
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(1) 增加一个源 S 和一个汇 Q 

(2) 从$向 x 的每一个顶点都增加一 条边; 从 y 的扭一个顶点都叫 I 增加一条边。 

(3) 原图 G 中的每-条边都改为相应的由 X 指向 F 的有 向边； 

(4) 置所有边的容暈为 

求网络 f 的最大流。在从 I 指向 y 的边集中，流量为1的边对应于二分图中的匹配边。 
最大流值对应于二分图 c 的最大匹配边数。 

具体算法可实现 如下： 


Jemplate〈class Graph^ viass Edge> class BMATCHING 


consl Grapli &G; 
public : 

BMATCHING(const Graph &G, int Nl) ； G(G) 

I 

I 

int s 山 maxilow; 

Graph F(G.V() + 2,1)^ 

for (int \ = 0 ； v < G ， V(); v + + ) 

s 

adjlt^rator < Edge > A(G ， v); 

for (Edge ^ e = A-beg(); I A^end(); e = A, nxt()) 

F. insert(e); 

} 

、 

s = G.V ()； t = G*V() + 1 ； 
for (int i - 0; i < N1; i + + ) 

F,insert(new KDGE(s, I)); 
for (i = Nl; i < s; i+ + ) 

K Jnsert(new EDGE(i 1 t, 1)); 

MAXFL0^< Graph» Edge> ( F, s, (* max flow); 
for (i = 0; i < Nl; i + + ) 

I 

adjlterator< Edge> A(i\ j )； 

for (EDGE * e ^ A.begOi ! A.endO; e = A. nxt()) 

if (e- > flow() = = 1 & & e- > from(i) & Si e- > oapRto(i) = = i ) 

coul < < e - > v() << r/ ->"<< e - > w() < < endl; 


上述算法中,原图为 g 。 顶点集 x 和 r 分别为!0，1，…， N 1 _IU y = iNi，m + 1， 

- l U 

由于网络/<’的每条边的容量不超过】,所以用增广路算法求其最大流所需的计算时间为 
其中 m 和 n 分别为图 G 的边数和顶点数，从而用上述算法求二分图的最大匹配所 
需的计算时间为 0(腿)。 

. 264 ■ 



5. 带下界约束的最大流问题 

前 I® 讨论的网络最大流问题中每条边（〃， w ) 都有一个容II约束 cap( : w )，它实际上是 
对边 u，w) 上流量的一个上界约朿。在更一般的情况下，除 r 边容 m 的 h 界约屯外，还有边 
流 S 的下界约束，即对于毎条边 G ， W) 还有一个边流量的下界约束 capIow(i. ， wh 在这种情 
况 F ，对可行流 flow 的容暈约束相应地改变为 caplow( v , it 1 ) 矣 flow (、 v ^ w ) ^cap( t ) ， mO 。 衣 
不这类网络的边结构进行如下相应 改变： 

• • • • • • • 參 

clasft EDGE 

irit pv, pw. pcap T pcaplovi, pflow, pflag ； 

publio ； 

EDGEl int v, int w，int caplow, int cap) : 

pv( v) t pw( w), pc ： feplow(caplow), pcap(cap) T pflow(O) , pfkg(O) i 
ini v() const ! return pv; 1 
iat w() const I return pw;; 
int cap() const 1 return pcap ； ! 
irit caplow( ) const \ ret urn pcaplow; i 
iat flow() const \ return pflow; \ 
bool from (jilt v) const 
\ return pv = = v; I 

void sublow() I pcap - = pcaplow; \ 

void addlow() \ pcap+ = pcaplow; pflow + = pcaplow; pflag = 1; ! 


bool reaidual(int v) const 

1 return (pv - " v & & pcap - pfiow >011 pw - " v & & pflow > 0 ); i 

int other (int v) const 
i return from(v) ? pw : pv;; 
int capRto(int v) const 

f return from(v) ? pflow - pcaplow * pflag : pcap - pflow；[ 
void addf)owRto(int v, int d) 

I pflow + = fram(v) ? - d ： d ;] 


对于带下界约朿的最大流问题通常可分两个阶段求解。第 l 阶段先找满足约束条件的可 
行流，第2阶段将找到的可行流扩展成最大流。 

第1阶段先将找满足约束条件的可行流问题转换成一个等价的循环可行流问题。变换方 
法是在原网络中增加一条容量充分大的边这条边将从$流到£的流量再送回到？构 
成一个循环流。原网络有可 行流当 且仅当新网络有循环可行流:、 

设 flow 是新网络的一个循环可行流，则 


• 265 • 




(1) 对每个 re 以包括 s ， f )， 有 

顶点 V 的流出暈-顶点 r 的流人量= 0 

即 flow ( v t w )- flow ( w j v ) - 0 

“.《 0C -£ ( u ,-. v '> Cz t 

(2) 对每一条边 （ t ! , ^ ) & E , cap ) ow ( v y iv ) ^ flaw ( v , w ) ^ cap ( v , w) c 

进一步对流迸行变换，设对每一条边 （ r ， w ) G E , x(v , w ) = fJow ( v t w ) - capIow ( v , 
w )， 代人上述 （1) 和 (2) 得到如下 结果： 

(3) 对每个顶点 r G V ，有 


x(l\ w) 

[r n 10 ) ^： t 


x ( tv ^ v) = sd( v ) 


， 2 )6 A 


sd( v ) = X) caplow( w 9 v) - oaplow( v ^ w) 

[w .v)(= E (i', til)£ E 

(4) 对每一条边 （ v ,w) G E ， x(v 、 w) ( cap( v ,w) - caplow( v i w) Q 

容易看山，; SsdG ) = 0。因此，上述循环可行流问题实际上就是前囱讨论过的一般网络 

te V. 


中的可行流问题。 


实现上述思想的算法 fcWhle^G ， S ， t ， sd) 描述 如下 : 


void read (char ^ filename T in t& s ， inl& t，vwtor < int > & sd) 


mt i 小 n ^ m, caplow ^ cap; 

if stream inFile; 

inFile. open( filename ); 

inFile> >o>>m>>s>>ti 

for (int k = 0 ； k<m；k + + ) 

! 

inFile > > i > > j > > caplow > > cap; 
sdL j] + = caplow; sd[ij - ^ caplow; 
insert (new EDGE(i, j, caplow, cap)) i 

i 

inFile.closed); 


void feasible(Graph &G. int s, int vector < iat > sd) 

參 

int as^ddt supplyi demand^maxflow = 0; 

Graph KG.V() + 2,1); 

for (int v = 0; v < G. V(); v + + ) 

I 

adjIterator< Edge> A(G, v); 

for (Edge * e = A.begO; ! A.endO; e = A-.nxtO) 

if (e- > from(v)) i e- > sublow( ); F,insert(e) ; i 
F\ insert (new EDGE(t ， s. 0 ， 1NT_MAX)); 
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S - (: . VO ; t = c.vo + i ； 

supply = 0; demand = 0; 
fW (mt i ^ 0; i < G. V()； i+ + ) 
if (sdfij > = 0) I 
supply + = sd[ i]; 

f. insert (new EDGE_:s> i, 0,sd[ij)) 


else I 


denianti - - sdLiJ; 

F.insert(iww EDGE(i P t ? 0 t -sd[i])) j 


MAXFLOW < Graph» Ed^e > (F» s, t, maxflow )； 
K.checksd(s, t^sw^dd); 

if(supply = - ss) cout < < "supply ok" < < end!; 

else cout< < "supply not enough" < < endl; 

if( demand = = (id) ooul < < ^demand met" < < endl 


eke cout < < rf demand not mef < < endl 


for ( 


< G.V()； 


adjlterator < Edge> A(G P v)； 
for (Edge * e = A.begO; ! A.end(); e 
if (e- > from( v)) e - > ad<How()； 


A.. nxt()) 


找到可行流 x 后，对每一条边 （ V , w ) 6 £，按照 flow ( v J w ) - x(v , to ) ^ capJowf v , w ) tf * 
算得到原网络的一个可行流 flowo 在此可行流的基础上，进一步用增广路算法扩展为一个最 

大流。上述2阶段算法吋描述 如下： 

* ^ ^ • - • - • • • ' • • k • - - • • ( • • -, , 

template < class Graph , class Edge〉class LOWEH 

I 

j 

const Graph &G; 
public: 

LOWER(Graph &(;, im s，int t, vector<int> sd) : G(G) 

§ 

i 

int maxflow = 0; 

: Teasible(G, s ， t,sd); 
adjIterator< Rdge> A(G, s); 

for ( Edge^ e ^ A.begO; ! A.end(); e = A.nxtO) 

if (e- > from(fs)) maxflow + =e— > ftuw(); 

MAXFLOW < Grtiph, Edge> (G, s, t, maxflow )； 

cout< < endl< < "Maxflow ="< < maxflow< < endl< < endl; 

G. outflow( ) \ 
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注意，在第1阶段中，残流网络中向 fa * 边 （〃 ， W ) 的容讀足 Oow ( V y ) ；在第2阶段中，残 
流网络中向后边 （rW )的容量是 flow (v y w ) - caplow ( v w w ) ， 因此算法中用标志变 M pflag 

表示算法的阶段。当算法在第1阶段时， pfl 吨=0;当算法在第2阶段时 ， P flag = U 在网络边 
结构中函数 ca p ftU )( V ) 修改为 

• • • • • | • 

int capRlo(inl v ) const 

I return from(v) ? pflow - pcaplow * pflag : pcap - pflow; : 

• • • • • • • j r • • 

6, 带下界约束的最小流问题 

带下界约束的最小流问题足找网络中满足流量上下界约束的最小可行流。 

与带下界约朿的最大流算法类似，可用2阶段方法求解。第1阶段先找满足约束条件的 
可行流 c 第2阶段以 i 为源点，以 s 为汇点，用增广路算法反向求解可找到最小可行流。 

带下界约束的最小流算法可描述 如下： 

• • • • • • • ^ r •- • • I _ • • / > a I • • • _ • . ^ • 

template < class Graph, class Ed^e > class LOWER 


const Graph &G ； 
public ： 

LOWER(Graph &G，int s, int t, vector < int > sd) : G(G) 

J 

int maxflow = 0; 
feasible(Gi sa.sd); 
adjIterator< EMge> A(G ， s); 

for (Edge * e = A.begO; ! A.end(); e = A^nxtf)) 
if (e. - > from(s)) maxflow - =e- > flow(); 

MAXFLOW< Graphs Edge> (G, t, s, maxflow); 

cout < < endl< < "Maxflow = 〃 < < ( 一 maxflow) < < endl< < endl; 

G. outflow(); 

鬱 

i 

I 

• # • • % • r - -• - ■•馨 •. 

7 . 表格数据取整问题 

给定一个 p 行9列的实数表格4 = uy ,其第；行和第 y 列的和分别为 q 和&表格数 
据取整问题要求将所给的实数哀格4变换为一个相应的整数表格丨\1,使得 

(1) 〜= muiifK 〜）； 

(2) = round( q 〜 = round(^ ; ) c 

其中， rcmmlU) 是对实数$的取整运算，吋以是下取整 flooK :t) ，也可以是上取整 ceiiU)。 
这个 M 题可以转换为一个带下界约束的可行流问题。对于给定的表格4，构造网络 C 如 
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下。网络 G 中存/> + i ? + 2 个顶点 \Syt yV ], W ■ ，认2, … ， A , I 和厂 X ' 7 f 4条边 

I ( i^ r T «. ! ; -), ( 5 , v f ) y ( Wj , t ); i - 1，2,…， p;j = 1,2,"*，^丨。其中，边（/〗 [ ，')的容5上1、界分 

别为 floor ( a 彳） 和 ceil ( % ); 边 （s ， ) 的容量上下界分別为 fbor ( ) 和 ceil ( q ) :边 （ f ) 的容 
量上下界分別为 floor ( ) 和 ceil ( ~ c 

易知，网络6’ 的一个可行流对应于表格数据取整问题的一个解。 

8.3 最小费用流问题 

8,3,1 最小费用流 

1. 网络流的费用 

在实际应用中，与网络流有关的问题不仅涉及流量，而且还有费用因素此 时网絡 的每一 
条边 （ t ) 除了给定容量 cap ( v ， w 、 外,还定义了一个单位流量费用 cost ( , , )。对于网络屮 
一 个给定的流 flow , 其费用定义为 

cost ( flow ) = cost ( V ^ w) x flow ( V ^ w ) 

{v n Ur)^~ E 

对于给定网络 c 中的流，其费用 4 计算 如下： 


template < Graph, ekss Edge > 
static int cost(Graph &G) 


ini x = 0; 

for (int v = 0; v < G.V ()； v+ + ) 


adjlleratur< Edge> A((; ， v); 

for (Edge ^ e = A.begO; ! A.end(); 


A.nxt()) 


if (e - > from(v) & Sr c - > costRto(e - > w()) < INT_ MAX) 
x + = e- > flow() * e- > custRto(e- > w()); 


return x; 


2 . 最小费用流问题 

对于一个给定的网络心要求 c 的一个最大费用流 fbw ， 使流的总费用 eost < flaw ) = 

y] cost ( V y w) x fiow ( V ,w) 最小:' 

3. 最小费用可行流问题 

对于一个给定的多源多汇网络 C ， 要求 C 的一个可行流 fluvv , 使可行流的总费用 

cost ( flow ) = C 0 St ( V J w) x flow ( V ^ w) 最小。 

(i f rv)^- E 

前面已经讨论过，可行流问题等价于最大流问题。类似地，最小费用可行流 M 题也等价于 
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最小费用流问题。 

8.3.2 消圈算法 


1 . 算法基本思想 

在4最小费用流问题有关的算法中，仍然沿用残流网络的概念。此时，残流网络中边的费 
用定义为 


int costRto(int v) 

return from(v) ? - pcost : pcost; 

/ _ m m % m • • • 

也就是说，当残流 M 络中的边是向前边时，其费用不变 ; 当残流网络中的边是向后边时，其 
费用为原费用的负值。 

由于残流网络中存在负费用边，所以残流网络中就不可避免地会产生负费用圈。而在与 
最小费用流问题有关的算法中 , 负费用圏是一个重要概念。 

最小费用流问题的最优性条件定理 网络 C 的 最大流 flow 是 C 的一个最小费用流的充 
分 _R 必要条件是 flow 所相应的残流网络中没有负费用圈。 

根据这一定理，可以设计出求最小费用流的消圈算法如下： 

j • • • r r * 讎讎 •馨 • • • • • • • • • • • • • • _ • • • • • • • ^ • * J ** kk * k • • 

步骤 0 用最大流算法构造最大流 flow 。 

步骤1如果残流网络中不存在负费用圈，则计算结朿，已经找到最小费 用流; 否则，转步骤2。 

步骤2沿找到的负费用圈增流，并转步骤1。 

• * §* 龜、 I ，齡 ••• " * • • • • • • 

2. 算法描述 

求最小费用流的消圈实现算法如下； 

，馨 參雜參 ■■參 ■■籲 • •• • • • • 8 m S m 9 m \ • ^ • r • • • • • • • • • • % * m • 

template < class Graphs cluss Kdg^ > class MIN COST 

I 

4 

I 

Graph &G; 
int s, t; 

vector < int > wt; 
vector < Edge ^ > st 
public ： 

MINCOST(Graph &G, int s，int t) : G(G) ， s(s), t(t), st(G.V()), wi(G.V{)) 

I 

int flow = 0; 

MAXFL0W< Graph, Edge>(G t ^ t t flow); 

for (int x = negcyc(); x ! = - 1; x - negcyc()) augment(x, x); 
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算法屮用向量 M 存储找到的负费用圈 。 算法的核心是找负费用圈筧法 negcycO , 


ini rieg^y c _0 


for(int I = 0 ；i < (7. V( ) ; i + +) 

! int ncg = negcyc(i); if( neg > =0) return neg ； ! 
return - 1 ; 


其中，函数 negcycG ) 以顶点 i 为起点，用 Bellman - Fonl 找负费用圈算法在残流网络中搜索负费 
用圈 o 


int ne^cyc(int as) 

i 

st.assign(G. V(),0); wt. assign(G. V( ), INT _ MAX) ； 

QUEUE < int > Q(2*G. V()); int IN = 0； 

wt[ssj = 0.0; 

Q.put(sks); Q,put(G. V()); 

while ( ! Q. empty()) 

i 

int v; 

while ((v = Q.getO) = = G.V()) 

I 

if (N + + > G. V()) return - 1; 

Q.put(G,V())； 

% 

l 

I 

adjllerator< Edge> A(G, v); 

for (Edge^ ^ - A.begO; [ A,end(); e = A‘nxt 〈）） 

I 

int iv = e- > other ，、 v); 

if (t? - > capRto( w) = - 0 ) continue; 

double P = wt[vl + e - > wt(w); 

if(P < w]) 

wtLwi = P ； 

// 开始搜索负费用圈 

for ( int node_ lest = v; (stL^oil^. test]! = 0 & & node. ! = 6&); 
node. Lest = ST(node_ test)) 

if ( ST(nocle_ test) = = w ) \ = e ； return h; : 

st[w] = e; Q.put(w)i 


return ^ 1; 
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找到负费用圈后由 augment( Xi x ) 从负费用圈的起点 x 开始，沿找到的负费用圈增流 


int ST (ini v ) const 

r 

4 

I 

if ( st [ v 」== 0) Icout < <" em > r !”< < en < Jl ; return 0; i 
else return sl [ v ] - > other ( v )； 


void augment(int int t ) 

I 

I 

I 

int d = sl [ t ]_ > capRto ( t ); 
for (ini v = ST ( t ); v ! = s ; v = ST ( v )) 
if ( stLv ] - > capRto ( v ) < d ) 
d = stL ' ] - > oapRtol v ); 
st [ t ] - > addflowrRto ( t ^ d ); 
for ( v = ST ( t ); v ! = s ; v = ST ( v )) 
st [ v ] - > addf ) ciwRto ( v 4 d ); 


3. 算法的计算复杂性 


如果给定的网络中有 《 个顶点和爪条边，且每条边的容量不超过 M ， 每条边的费用不超 
过 C 。 由于最大流的费用不超过 mCM ， 而每次消去负费用圈至少使得费用下降1个单位，因 


此最多执行 mCM 次找负费用圈和增流运算。用 Bellman - Ford 算法找1次负费用圈需要 


OUri ) 计算时间。因此，求最小费用流的消圈算法在最坏情况下需要 OU ^ CM ) 计算 
时间。 


8.3.3 最小费用路算法 


1 . 算法基本思想 

上面的消圈算法首先找到网络中的一个最大流，然后通过消去负费用圈使费用降低。最 
小费用路算法不用先找最大流，而是用类似于求最大流的增广路算法的思想，不断在残流网络 
中寻找从源 s 到汇 z 的最小费用路，然后沿最小费用路增流，直至找到最小费用流。残流网络 
中从源 s 到汇 t 的最小费用路是残流网络中从 5 到 f 的以费用为权的最短路。 

残流网络中边的费用定义为 

, Jcost( V , w) ( y ， w ) € P+ 

wt( V ^ w ) ^ \ 

- cost ( w 9 v ) (v f w ) & 

即当残流网络中边（心 幻足向 前边时，其费用为 C 0 S t ( 〃，《;); 当是向后边时，其费用为 

- COSt( W ， 公 ）0 

按此思想，可以设计出求最小费用流的最小费用路算法 如下： 
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步骤 0 初始 nj ■行0 流： 

步骤1如果不存在 ii 小费 用路屬 ii 算结束， a 经找到最小费 用流； 否则,用最短路箅法在残流网络中 
找从$到 r 的最小费用可增广路，转步骤夂 

步骤2 沿找到的最小费用吋增广路增流，并转步骤1。 


2. 算法描述 

求最小费用流的最小费用路实现算法 如下: 


template < class Graph，class Ecl^e > class MINCOST 

I 

參 

I 

Graph &G; 
irtt s， “ flow; 
vector < mt > wli 
vector < Edge * > si； 
public : 

MINCOST(Graph &G. int int t, int »e) : 

G(G)，s(s)， t(t) ，flow(se) t st(G. V()), wt(G* V()) 

I 

1 

while(shortest! ) ) augment(s T t ); 

I 

I 

i . 

it 

• ••- • • ---- 八 

找最小费用路的算法由 shortest () 实现如下： 


bool shortest () 

I 

4 

I 

st.assign(G. V{),0); wt♦assign(G, V() ， INT_ MAX); 
yUKUE<int> Q(2* G. V())j int M = 0; 

if(flow < - 0) return false; 
wt[s] = 0.0; 

Q.pui(s )； Q.put{G.V())i 
while ( ! Q.emptyO ) 


while ((v = Q ^lO) - - G.V()) 

I 

if ( M + + > G.V()) return (wt[ t] < INT_ MAX); 
Q.put(G.V())i 

I 

» 

adjherator< Kdge> A( G, v); 

for (Edge * e = A.begOj | A.^nd(); e - A ， nxt()) 
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int w = e - > oth^r( v); 

if (卜 > capRto( w) = = 0 ) continue ； 

int P = wt*.v] + e - >wt(w); 

if (P < wtLw])| wt[wj - P; stLw] = Q.put(w); • 

l 

喔 

I 

return (wl[t]<INT_ MAX )； 


找到最小费用路后由 a ugment ( s , f ) 从 s 开始，沿找到的最小费用路增流。 

參 參 ，鬱，_ ■'鵞 籲 馨鬱 / i / 参籲 參 * • * a * * & 

int ST (int v) const 

I 

^ (st[ v] = =0) icont < <"enw!"< < endl;return 0 j i 
else return st[v] - > other(v); 

I 

void augment(int s, ini t) 

i 

int d = st[l] - > capRto(t); 

for (int v = ST(t); v ! = s; v = ST(v)) 

if (st[v] - > capRto(v) < d) d = $l[v] - > capRto(v); 

if (d> flow) d" flow; 

st[ t] - > addflowRto(t, d); 

for ( v = ST(t); v ! = s ； v - ST(v)) stLv] - > aJciflowRto(v, d); 
flow - = cl; 


3. 算法的计算复杂性 

算法的主要计算量在于连续寻找最小费用路并增流。如果给定的网络中有 n 个顶点和 
m 条边，且每条边的容量不超过 M ， 每条边的费用不超过 C 。 由于每次增流至少使得流值增 
加 1 个单位，因此最多执行 M 次找最小费用路算法。如果找】次最小费用路需要 
5(m ， / 1 ， C) 计算时间，则求最小费用流的最小费用路算法需要 0(MS( C)) 计算 时间。 

8,3.4 网络单纯形算法 

1. 算法基本思想 

消圈算法的计算复杂度不仅与算法找到的负费用圈有关，而且与每次找负费用圈所需的 
时间有关。虽然网络单纯形算法是从解线性规划问题的单纯形算法演变而来,何从算法的运 
行机制来看，可以将网络单纯形算法看作另一类消圈算法。其基本思想是用一个可行支撑树 
结构来加速找负费用圈的过程。 

对于给定的网络 C 和一个可行流，相应的可行支撑树定义为 C 的一棵包含所有弱流边 
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的支撑树。 

网络单纯形算法的第一步就是构造可行支撑树。从一 ♦ 个可行流出发，+断找由弱流边组 
成的圈，然后沿找到的弱流圈增流，消除 所有弱 流圈。在剩下的所有弱流边中加人零流边或饱 
和边构成一棵可行支撑树。 

在可行支撑树结构的基础上，网络单纯形算法通过顶点的势函数，巧妙地选择非树边，使 
它与可行支撑树中的边构成负费用圈。然后，沿找到的负费用圈增流。 

定义了顶点的势函数屯后，残流网络中各边 U， ， w )的势费用定义为 

C * ( V , ttO - c{v J w) - ( v) — 0( w )) 

其中，是 U，M) 在残流网络中的费用。 

如果对町行支撑树屮所有边（ v y w )^ cHv , w ) = 0 ,则相应的势函数 0 是一个冇效势 
函数。 

对于一棵可行支撑树，如果将一条非树边加人可行支撑树，产生残流网络中的一个负费用 
圏，则称该非树边为一条可用边。 

可用边定理 给定一棵可行支撑树及其上的一个有效势函数，非树边 e 是一条可用边的 
充分必要条件是， e 是一条有正势费用的饱和边，或 e 是一条有负势费用的零流边 v 

事实上，设 <* = ( V ,如 >。边 e 与树边 h 1 t d 构成一个圈 cycle ： q / 2 ，…， Q ，/ u 其中， 
v t {y w - t ti , - cycle ： t ly k ， q 。按照边的势费用定义有 

c(mj ， u 〉 = c ^ (w y v) + 0( Q)— 少 ( 丈 i) 
c ( t u t 2 ) = 少 （ h ) - 
c ( [2 ， 【3) : ^ 2 ) — 中（尤 3) 


c(t d .^t d ) = 中 - ^(t d ) 

各式相加得 

cost ( cycle ) = c * (w 7 v) 

由此可见 , e 是一条可用边当且仅当 co S t(c y de) < 0; 当且仅当 <0; 当旦仅当 
e 是一条有正势费用的饱和边，或 e 是一条有负势费用的零流边。 

最优性条件定理 对于给定网络 C 的可行流 flow 及相应的可行支撑树如果不存在 r 
的可用边，则 flow 是一个最小费用流。 


事实上，如果不存在 r 的可用边，则由 珂用边 的定义知残流网络屮没有负费用圈。又由最 
小费用流问题的最优性条件知心 w 是一个最小费用流。 

根据这一最优性条件定理，可以设计求最小费用流的网络单纯形算法如下： 


步朦0 构造 flow 为初始可行0流。构造相应的可行支撑树 r 和有效的顶点势函数。 

步骤 1 如果不存在 r 的可用边，则计算结束，已经找到最小费 用流; 否则，转步骤 2 、 

步骤2 选取 r 的一条可用边与 r 的树边构成负费用圈，沿找到的负费用圈增流，从 r 屮删去一条饱和 
边或零流边，重构蚵行支撑树，并转步骤 u 


2.算法描述 


实现网络单纯形算法首先面临的是如何表示可行支撑树。可行支撑树需要支持如下 3 个 
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基本 运算： 

(1) 计算顶点势函数。 

(2) 沿负费用圈增流。 

(3) 删除一条树边或插入一条树边:、 

冇多种数据结构可满足上述要求。较简单的一种数据结构是父指针 A 量。用父指针向董 
存储支撑树中各边。向量单元中存储的边是支撑树中的一条指向根结点方向的边 
(v f w ) o 结点^的父结点是 W ;边 St [ d 的父边是 St [ W 〕。 

用此数据结构可实现如下求最小费用流的网络单纯形 算法： 


template < class Graph, clasp Edge〉class MINCOST 


const Graph &G; 
int s ， t ， valid; 
vector < Edge * > st; 
vector < int > mark, phi; 
public : 

MlNCOST(Graph &C, int s t im t, int 沐)： 

G(G), s(s), t(0, st(G.V()), mark(G ， V() ， -1), phi(G.VO) 



upbound( m ， c); 

m = m ^ G. V() i (，： c 杯 （〕 .V(); 

Edge ^ z ^ new EDGE(s, t, se ， c); 

C.insert(z); 

z- > adciflowRlo(t ? se); 
dfsR(z.t); 

for (valid = 1; ; valid + + ) 

I 

phi[tj - z- > costRto(s); 
markLt] - valid; 

for (int v - 0; v < G, V() ; v + 十） 
if (v 1 - t ) phi[v] = phiR( v) ; 

Edge * x = best eligible (); 

int rcost - costR(x, x - > v()); 

if (full(^) & & WO^l < = 0 I I empty(x) & ^ r<；ost > " 0) break i 
update(augment(x) ^ x); 

I 

G. remuve(z) ； ddete z ； 


算法中的向量 P hi 用于存储顶点势函数少的值。向景 mark 是计算势函数时用到的标记 
向量。参数 se 是流入源 5 的流量。算法开始计算前先在网络中增加一条虚边 z = 该 
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边的容 fi 为 se ， 费用充分大。初始时，该边中的流量为％。这条边的作用足在网络最大流的流 
量小于此时，将多余的流通过该边送到汇 L 其中用下面的函数 upboumKm j ) 来计算网络 
中的最大边容量和最大边费用： 

void upbound(iut &cap，int &cosl) 

I 
1 

cap = Ojcusl = 0 ； 
for (int i = 0;i< G. V();i + +) 
for (int j = 0;j < G- V();j + + ) ! 

if (G^edge( v > w) & & cap < G . edge( v , w ) 
cap = G.edge( v ， w) - > cap(); 
if (G ， edge( v ， w) & & cost < G . edge( v ， w) 
cost = G.edge(v, w) - > cost(); 


- > cap()) 

- > eoslO) 


函数 dfsme, W ) 以边 e 的顶点 zr 为根结点，用深度优先搜索算法建立 初始女 撑树。 

• • • • • • • • • i , • • • • • • • • * ^ • 

void dfsR( Rdge ^ ejnt ^') 

i 

int v ~ e - > other( w); 
m[ v] = e; 

mark[v] = 1; mark[w] = 1; 
dfs( v); dfs( w); 
mark.assign(G. V(), - 1); 

I 

// 从®点 V 开始进行深度优先捜索 

void dfs(int v) 

I 

adjlterator < Edge> A(G ? v); 
for (Kdge* e - A.begO; ! A.end() 
int w - e - > olher( v )； 
if (mark[ w 」 ==-1) ! st[ wj = e; 


;e = A. nxt()) \ 
mark[ w 1 = l; dfs{ w) ; j 


按照有效顷点势函数的定义，对支撑树的所有边 （ f ， W )， 有 C * W ) =0,因此有 
少 () - C ( t ； ， M ；) 。函数 phiR ( l ；) 依此公式在支撑树中递归地计算顶点势函数的值 < P ( v)o 

在 e ~ st [ v ] = (v , w )时，函数 ST [幻 ] 返回 w 。 

• ^ • • • • •• 9 % % 9 9 • • 

int ST (int v) const 


if (st[v] = =0) return 0; 
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else rehirn sl_v」- > other(\); 


int phiR(int v) 

I 

t 

I 

if (markLvj = = valid) return phi[ \ : ; 

phi[v : 二 phiK( ST(v)) - stLvj - > uoslKld(v); 

mark[ vj = valid; 

return phi [、； 

l 

I 

确定网络单纯形算法效率的一个 t 要因桌是选取叫用边的算法效率。有多种+同策略实 
现这 t 选择。下面的算法选取使负费用圈的费用绝对值最大的可用边。 

函数 costR(^i ； ) 计算边 e 的势费用。 

• m m ^ 

_ _ • 

int costR(Edge ^ e t int v) 

int R = e- >cosl() + phi[e - > w() 1 - plu ： e- > v()]; 
return e- > from(v) Y R : - R; 

I 

f 

Edge * bestelip ： il)le() 

Edge * x - 0; 

for (int v = min = INT.MAX ； v < G.V(); v + +) 

I 

1 

adjlt^rator < Edge > A( v); 

for (Edge * e = A.liegO; ! A.end(); e = A.nxt()) 
if (e - > capRlo(e - >other(v)) > 0) 
if (e - > capRto(v) = = 0) 
if (costfUe, v) < min) 
i x = e ； min - costR(e, v); ! 

i 

return x; 


选出可用边 ; t 后，由 augmem( ： 0 沿边 $ 和支撑树的树边构成的负费用圈增流。完成增 
流后，返回负费用圈中的一条饱和边或零流边。 

算法首先根据可用边 x 是饱和边还是零流边来确定负费用圈的方向然后，计算 
顶点〃和 u ； 的最近公共祖先 r 。 负费用圈由边 （ t ，， uO, 支撑树中从 顶点 & 到 r 的路，以及支 
撑树中从 r 到顶点〃的路所组成。沿此负费用圈计算出最大可增流 M rf ， 然后再一次沿负费 
用圈对每一条边增流心由于可行支撑树中有饱和边和零流边，闪此，如果算法找到的负费用 
圈中含有这种边，则出现退化情况，即算法中的最大可增流量 4=0 。在这种情况下，并没有实 
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际增流。因此算法可能会陷人无限循环。幸运的是有一种简申的方法可以避免循环,、如果在 
选取支撑树删除边时，总选取最靠近根结点的那条边，则可以保证算法不会无限循环。卜'面的 

算法 augmenlU ) 正是按照这种策略选取删除边的。 

• • 

Edge * augment(Edge * x ) 

I 

itU v = fuU ( x )? x - > w ()： x - > v (); // 负费用圈的方向 

int w = x - > other ( v ); 

int r = Mv, w); // 顶点 v 和 w 的最近公共祖先 

int (J = x - > capRto( w); 
for (int u = w; u ! = r; u = ST(u)) 
if (st[u] - > capRto(ST(u)) < d) 
d = stf u] - > capRto(ST(u)); 
for ( u = v; u ! - r; u = ST(u) ) 
if (sl[u] - >capRto(u) < d) 
d = al[u] - > capRto( u) ; 
x- > addflowRto( w, d); Edge * e = x; 
for ( u - w; u ! = r; u = ST(u)) 

I 

st[uj - > addflowRtD(ST(u), d); 

if (st[u] - >capRto(ST(u)) = - 0) e - st[u]; 

i 

for ( u = V ； u ! = r ； u = ST(u)) 

I 

J 

st[u] - > addflowRio(u ， d); 

if ( st [ - > capRto ( u ) - - 0) e = st [ u ]; 

return e; 


其中，如下函数 full (幻和 emptyU ) 用于判别边 r 是饱和边还是苓流边。函数 lca ( r , «，）用于 
计算顶点*和的最近公共祖先。 

• _ • • • • • J m m • _ 

bool full(Edge * x) 

J 

I 

return (x- > eapRto(x - > w()) = = 0) i 

I 

I 

bool empty (Edge * x) 

I 

return (x- > capRtofx- > v()) = =0 )； 


int lca(int v, Int w) 
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mark[v] - 十 + valid; mark L Wj valid; 
while (v ! = w) 

I 

if (v ! = t) V = ST(v); 

if (v ! - t & & markLv] = = valid) return v; 

mark[v 」 - valid; 

if (w ! = t ) w - ST(w); 

if (w ! = l & & mark [ w ] = = valid) return w; 
raarkLw] = valid; 



由 rnigrnem ( 幻完成沿负费用圈增流后，返回的边 e 是支撑树中的一条饱和边或零流边。 
算法进一步将边 ; c 加人支撑树，并从支撑树中删去边 e ， 重构新的可行支撑树。这个任务由算 
法 update( e , x ) 来实现。设％顶点 u 和 y 的最近公共祖先是 r ， 则边 e 
在支撑树中从顶点《到 r 的路上，或在支撑树中从顶点到 r 的路上。当边 e 在支撑树中从 
顶点 ix 到 r 的路上时，删除边 e 后，支撑树中从顶点 u 到顶点 (2 的路上各边方向应该反转。同 
样，当边 e 在支撑树中从顶点 r 到； • 的路上时，删除边 e 后，支撑树中从顶 点： ; 到顶点 a 的路 
上各边方向应该反转 2 

•• i^i • • ^ • . •% • • j • • j • • • ^ • • • • • r • r - • • 

bool ⑽ path(int a, int b，ini c) 

參 

for (int i = a; i i = c; i = ST(i)) if (i = = b) return true; 
return false; 

} 

void reverse(int u, int x) 

I 

1 

Edge * e - »t[u]; 

for (int i = ST(u); e- >other(i) J = x; i = e- > Olber(i)) 

I Edge * y = st[ij; st[ij = e; e ^ y ； f 

i 

void apdafe(Edge * w, Edge * y) 

I 

1 

if( w = = y) return; 

int a - y- > w(), v = y- > v() , x - >v - > >v ()； 
if (x = = t J f st[x] ! - w) x = w- > v(); 
int r = lca(u ， v )； 
if (onpath(u, x t r)) 

I reverse(u, x); st[u] = yj return; > 
if(onpath(v, x ， r)) 
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I reverse( v , x); stl_v 」 二 v ； return; \ 

w 

I 

I 

在匕面的算法中，函数。 npath( 〜 hc) 用于判断顶点 A 是否在顶点《到顶点 c 的路上。 
函数 reverse( w , ^ ) 用于反转从顶点 u 到顶点 x 的路卜_各边的方向 

3. 算法的计算复杂性 

如果给定的网络中有《个顶点和 m 条边，且每条边的容董不超过 M ， 每条边的费用不超 
过由于最大流的费用不超过 mCM ， 而每次消去负费用圈至少使得费用下降 1 个单位，因 
此最多执行 mCM 次找负费用圈和增流运算。用网络单纯形算法找 1 次负费用圈需要 0( m) 
计算时间。因此，求最小费用流的网络单纯形算法在最坏情况下需要 0(m 2 (CM )) 计算 
时间。 

8.3.5 最小费用流问题的变换与应用 

1. 带下界约 束的最小费用 流问题 

与带下界约束的最大流问题类似 , 带下界约束的最小费用流问题也分 2 阶段求解。第 1 
阶段先找满足约束条件的町 行流 ; 第 2 阶段将找到的可行流扩展成最小费最大流 。 

• ^ ^ I • j • 丨 • r • j ^ • • •• •• • 參 • • • • • ^ • • • 

template < class Graph，class Edge > class LOWER 

i 

§ 

const Graph &G; 
public : 

L0WER(Graph &G, ii“ s，int t，int 9e，int te, vector < int > sd) : G(G) 

I 

1 

int maxflow - 0; 
feasible((;, s ， t,$d 〉； 
adjIteralor< Edge> A(G, s); 

for (Edge^ t 1 = A.beg ()； ! A.eiid(); e 二 A.nxt()) 
if (e— > from(s) ) maxflow + =e- > flow(); 

MINX05T < GRAPH < EDGE > , EDGK>(G, s，U se); 

G.outilow(); 


与带下界约束的最大流问题不同之处是第 2 阶段调用的是最小费用流算法。 


2. 带下界约束的最小费用最小流问题 


与带下界约束的最小流问题类似，带下界约束的最小费用最小流问题也分2阶段求解 2 
第1阶段先找满足约束条件的町 行流; 第2阶段以£为源点，以 s 为汇点，用最小费用流算法 
反向求解可找到最小费用最小可行流。 


template < class Graph , class Edge > class LOWER 
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const Graph & G; 
public : 

LOWER( Graph &G t iut s t int t 1 inL sejnt te>vector < int > sd) : G( G) 

__ 

、 

int maxflow ^ 0; 

feasiWe( G , 

adjlterator < Edge> A(G ， s); 

for (Edge* e = A.begO ； ! A .end (); e = A,nxt()) 

if (e - > from(s)) max flow - = e - > flow(); 

MINCOST< GRAPH< EDGE> , EDGE>(G, L, s, se); 

G.outflow() J 

1 

l. 

• • • • • a J ^ _ m m m m m SI* • • • • r • • • _ ■■■■■■•/ ■■■■ 

与带下界约束的最小流问题不同之处是第 2 阶段调用的是最小费用流算法。 

3. 最小权二分匹配问题 

给定一个带权二分图//，找出好的一个最小权二分匹配 。 这个问题也称为指派问题 C 
设 H 的二分顶点集为和 F2 。 构造与 ff 相应的网络 C 如下： 

增设源点 s 和汇点 i 。 源点 s 到 F1 中每个顶点有一条边，每条边的容量为〗，费用为 0 。 
V2 中每个顶点到汇点 f 有一条边，每条边的容量为 i ， 费用为 0 。//中每条边相应于 G 中一 
条边，该边的容量为 1 ，费用为该边在开中的权。 

易知， C 的最小费用流相应于的一个最小权二分匹配。 

上述变换可用如下算法实现： 

、气 j . . • ' ” •八 ■ ~- - 、• * . - - - - •- •奢- m m • ^** * *■ . 

template < class Graph, class Edge〉class ASSIGNMENT 


const Graph &G; 
public ： 

ASSIGNMENT(const Graph &G, int M) : G(G) 

I 

int s ， t，sum = 0; 

Graph F(G.V() + 2 y l)i 

for (int v = 0; v < G. Y(); v + + ) 

I 

adjlterator < Edge > A(G, v); 

for (Edge* e = A.begO; \ A -end(); e - A.nxi()) 
FJnsert(e); 
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s=G.V(); t ^ G.V() + l; 

for (int i = 0; i < N1; i + + ) F. insert (new EDGE(s, i, 1 ， 0)); 
for (i = Nl; i < s; i+ + ) F-insert(new EDGE(i ， t ， 1 ， 0)); 



MINCOST< Graph, s, t, Nl )； 

for (i = 0; i < Nli i + + ) 

I 

J 

afljlterator < Edge > A(F ， i); 

for (EDGE * e - A. beg(); ! A.enci( )； e. = A. nxt( )) 
if (t 3 - > flow() = = 1 & & e- > from(i) )| 
cout << e - > v( ) < < ’ < < e - > w( ) < < entil; 


4. 特殊线性规划问题 

考察下面的特殊线性规划 问题 : 


irnncx 


Ax ^ b 


x^O 

其中，约束系数矩阵 4 具有特殊形式，即 A 是一个 0-1 矩阵，且 4 的每一列中的 1 是连续排 
列的。例如， 8.1 节中讨论的仓库租赁问题就是这类线性规划问题。下面用一个简单例子说 
明算法思想。 
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引人松驰变量将不等式约束转换为等式约束。 
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其中，第 5 行是故意加入的恒等式 0% + 0y = 0 。 
从最后一行开始,每行减去上一行得 
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此时的系数矩阵中，每一列有 … 个 i 和一个 _ 1 ，正好对应网络中一条边的起点和终点。 
另外，右端矩阵各行数值的代数和为 0 。由此，可构造相应的网络如图 8-7 所示。 



图 8-7 与特殊线性规划问题对应的 W 络 

在一般情况下，特殊线性规划问题有个变量和 m 个约束，则与特殊线性规划问题对应 
的网络中有 m+1 个顶点和 m + n 条边。设网络中的 m + 1 个顶点为 1 ， 2,…， w + 1 。约束 
矩阵 4 的每一行和每一列都对应于网络中一条边。例如，第纟行对应于网络中的边 
U + 1 ， 0, 该边对应于松驰变量％ , 其费用为 0 。如果第 J 列中从第行到第 g 行为连续的 1 ， 
其余各行为 0, 则第 J 列对应于网络中的边 ( Pi g + 1) ，该边对应于变量 ~ ，其费用为 c, 。网络 
中第〗个顶点的流人 ( 或流出 ) 量为 + 1 - 心。 

这是一个多源和多汇的网络，引入虚源 s 和虚 汇/后 ，可将其变换为标准的单源单汇网 
络。该网络的一个最小费用流对应于特殊线性规划问题的一个解。 

根据上面的讨论，可设计解特殊线性规划问题的算法如下： 


class Con&ecLP 

i 

int neon, // 约束数 
nvai, // 变量数 

* * a，M，supply; 
public : 

ConsecLP(cKar * filename) 

I 

I 

read( filename); 

GRAPH< EDGE> G(noon + 3,l)； 
constructG(G); 

MINCOST< GRAPH< EDGE> , EDGE>(G, s，t，supply); 

coui < < " "<< cod < GRAPH < EDGE > ， EDGE>(G)< <endl; 

G.outx(); 
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其中， read 读人特殊线性规划问题的 参数; 根据读人数据构造相应的网络 G ，然后 
用最小费用流算法 求解； 函数 ouuO 根据最小费用流输出特殊线性规划问题的解。 

构造网络的算法 constructG 描述如下： 


void constructG(GRAPH < EDGE > &G) 

I 

int i,j，p，q，maxc = 0; 
a[ neon + 1 ]〔0] = 0; 

for (i = neon + 1 ；j> 1 ;i- - )a[i][0] - = a[i- l][0]; 

for (i = 1 ;i< - neon;i + + ) if (a[i][0] > maxc) maxc + = a:i][0]; 

for (j = 1 ；j < = nvar;j+ + ) 

s 

i 

p" 0 ； q= 0; 

for (i = 1;i < = neonji + + ) 

I 

if((p= =0) & & (a(.ijLj] = - l))p~ i ； 
if ((p>0) & & (c\- = 0) & & (a[i][j] = =0))q = i; 

( 

if (q = = 0) q = neon + 1; 

EDGE * e= G.edge(p - 1, q- 1); 

if ( e= - 0 I I e! 0 & & e- > cost() > a[0j[j]) 

G,insert(new EDCE( p- 1 y q - 1 1 maxc 5 a[0]!.j] ,j)); 

I 

for (i= 1 ;i < = neon;i + + ) G-insert(new EDGE(i T i - 1， maxcn0 f 0)); 
s = neon + 1; t = neon + 2j supply = 0; 
for (i = 1; i < = neon + 1; i + + ) 
if (a[i][0] > = 0) 

1 

supply + - ati^Oj; 

(y. insert (new KDGE(s» i - 1» a[i][0] ,0^0)) ,■ 

I 

I 

dse G. itisert(new EDGE(i- I, t» - a[i] [0] ,0,0)); 


5, 最小逃脱问题 

—个由肌行》列的结点组成的栅格状无向图如图 8-8 所示 u 用 U ， w ) 表示位于第丨行 
第 ） 列的结点。满足 j = l 或或> =1或7=^1的结点是边界结点，其他结点为内 
部结点。在每一 个内部 结点处，都有4个其他结点与其相邻。对于栅格中/个给定的起始点 
Uip ^, D ) ，…， U /，> y ) ,逃脱问题要求确定是否存在从这/个起始点开始到栅格边界 
的/条不相交的路径。例如，图 8-8 U ) 的栅格有一个逃脱，而圈 8-8( b ) 的栅格就没有逃脱 3 设 
每条栅格边的长度为1。最小逃脱问题要求在所给栅格的所有逃脱中，找出逃脱路径总长度 
最短的一个逃脱。图 8-8( c ) 中的逃脱是一个最小逃脱。 
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Rl 8-8 逃脱问题示例 

对于给定的 m X 栅格，构造相应的费用流网络 C 如下： 

(1) 将每一个栅格点（ V ， W ) 拆成两个顶点和 v ( i ， ),2); 用一条边（ v ( i 9 j ,\), 
2)) 连接这两个顶点，并设该边的容量为1,费用为0,〖矣 m ,】 

(2) 在一般情况下，将原来与栅格点 U ， wO 相邻的4个栅格点 （ i -〗， y )，（〖 + i ， y ), U ， 
卜 1) 和 + 变换为8个顶点，它们与顷点 K 〖， y ， l ) 和 t (“乃 2) 的连接情况如图 8-9 所 
示。这8条边的容量和费用均为 U 当原栅格点是起始栅格点时，没有进人顶点 

乃 1) 的4条边。当原栅格点 U ， kO 是边界栅格点时，没有从顶点 tKi ， y ，2) 发出的4条边。 



V" - 1" J) 
1</+1,7 J) 

v(i-, 广 U) 


图心9栅格点扩充变换 

(3) 另外增设一个源 s 和一个汇 I 

(4) 对每一个起始栅格点 U ， w 〉增加一条边 (s t vU.jA)), 其容量为】，费用为0。对每 
一个边界栅格点 （ 1 ；，增加一条边 ( ，） ,2),0 ，其容量为 1 ，费用为 0 。 

求网络 G 的最小费用最大流。当其流量为 / 时，求得的最小费用最大流即对应于一个最 
小逃脱，其最小费用即为所求的最小逃脱路径总 长度」 

如果仅要求判断是否有一个逃脱，只要求网络 C 的最大流。当流量为 / 时，所给栅格至 
少有一个逃脱。否则，所给栅格没有逃脱。 

根据前面的分析 , 可以将原问题变换为一个网络最小费用流问题。用解网络最小费用流 
问题算法即可有效地找到给定栅格的最小逃脱。具体实现算法 如下： 

讎 ^ 參 馨籲___ • • 

class ESCAPE 

瞻 

1 

int n ? mm,nnt* st ； 
mt btype(int i,inl j) 

I 

int b = 0; 

// b = 0 表示内部未占点； 

// b = 1 表小边界未占点； 

// b= 2 表示内部被占点； 

// b = 3表示边界被占点； 
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if((i= = 1) I I (i = = mm) f 1 (j - = l)M(j = = nn)) b + + ; 
if ( start (\ ,w)) h+ : = 2; 
return l>; 


hit uum(ii)l i,int j) 


I 


if ((i> = 1) & &(i< = mni) & & (j> = 1) & &(j < = nn) ) rKum ( (i - 1) ^ nn +j) ^ 2; 
else return ^ 1; 


start(int i，int j) 


return st[(i - 1) * nn +jj ； 


void const me “; (GRAPH < EDGE > &G) 

I 

int ul 5J , v[5]; 

for (int i == 1;i < = min;i + + ) 
for (int j = 1 ;j< = nn;j + + ) 

? 

int k = huth( V ， w); 
ini btype(v, w); 

uL i J = num (卜 1 ,j) ; u[2] = num(i,j ■ 1); 
u[3j = num(i + 1 ij) j u[4] ^ num(i,j+ 1); 

v[l] = btype(i - l,j); vi.2j = btype(i,j- 0» 
v[3j = btype(i + I .j); v 〔 4] = l>type(i，j + i); 

G.msert(new EDGE(k, k+I ， l ， 0)); 
if (1>> 1) G, insert (new EDGE(^ T k, L ,0)); 
else for (int x = l;x < 5;x + + ) 

if ((u[x]>0)&&((v[x]= =0)1 l(v[x]= =2))) 
G.in3ert(new RDGt(u[x] + 1 ,k, 1,1)); 
if ((b ^ ^ 1)| I (h= = 3)) G. insert (new EDGE(k + 1 T t > 1 tO)); 


void read (char « filename) 

I 

i 

ini i,j ； 

ifst ream in File; 
in File. open ( filename ); 
infile > > mm > > nn > > f ； 
n = mm * nn * 2 + 2; 
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ftt - n^vs inti mm ^ rm + 1 j ; 

for〔i = 0: j < = niJiJ * mi; i + + ) stl i. = 0; 

s = 0; t 二 1; 

for (int k = 0;k< f;k+ + ) | 
iriFile > > i > > j; 
st[ (i - 1) * nn + jj = 1; 

i 

inFiie.dose(); 

i 

void trans(inl i, int int & v) 

\ 

int k = i/2; 

k/nni 
v - k%tin; 
if (v = =0) v = nn; 
else u + + ; 


void output(GRAPH < EDGE > &G) 


int tii ， vi,u2,v2,sum = 0: 
adjlterator< EDGE> A(G，a); 

for ( KDGK* e = A . beg( ); ! A.end(); e - A. nxt() ) 
if (e- > from(s) & &e_ > flow() > 0) sum + + j 
if (sum< 0 Icout < < "No solution[^ < < endl;return;; 
cout < < ^succesful! w < < endl; 
sum = 0; 

for (int i 二 2;i<n;i+ + ) i 

adjIteiator< EDGE > A(G, i); 

for ( EDGE * e = A • beg(); I A. end( ); e 二 A ■ nxt()) 
if (e- > frojn(i) & &e_ > flow() > 0& &e - > cost() > 0) I 
trans(i>ul, vl); 
trans(e- >w() ，u2，v2); 

cout< <"("< <ul < <",< < vl < <") - - > ("< <u2< <"，"< <v2< < n y< <encfl? 
sum + + ; 


cout < < "Mincost = ,r < < sum < < endl ； 

) 

r 

I 

publiu: 

ESCAPE(char * filename) 


read (filename); 



GRAPH < EDGE > (;(n ， l); 
constructG(G); 

M1M ： 08T< GRAPH < EDGE > , EDGE >((.; ， s ， I ， f); 

output (G ); 


习题 8 

8-1 试给出一个线性规划的例子，使其可行 K 域是无界的，但其最优目标函数值却是有 
限的。 

8-2 试将单源最短路问题表示为一个线性规划问题。 

8-3 试将网络最大流问题表示为一个线性规划问题。 

8-4 试将网络最小费用流问题表示为一个线性规划问题2 

8-5 运输计划问题。某集团公司拥有自己的产品运输网络。该公司现在生产 A 种不同 
的产品，每种产品都需要从其牛产地运输到销售地。假设第 i 种产品的产地为&，销售地为 
L 需要的运输量为尤。集团公司需要规划其运输计划满足各种产品的运输需求。试建立该 
问题的线性规划模型。 

8-6 试用单纯形算法解下面的线性规划 问题： 

max z - a; j + ^2 + ^3 
s.l, 2x] + 7.5^2 + 10 000 

20 文丨 +5^2 + 10^3^30 000 

A j ， X 2 ,X 3 ^0 

8-7 边连通度问题。无向图 G = ( K ， E ) 的边连通度为 A 是指最少需要移去 C 的 A 条边 
才能使 C 成为不连通图。例如，树的边连通度为1;循环链的边连通度为2。试用网络最大流 
算法求给定图 G 的边连通度。 

8-8 试证明有向无环网络的最大流问题等价于标准网络最大流问题。 

8-9 试将无向网络最大流问题变换为标准网络最大流问题。 

840飞行员配对方案问题。第二次世界大战时期，英国皇家空军从沦陷国征募 了大量 
外籍飞行员。由皇家空军派出的每一架飞机都需要配备在航行技能和语言上能互相配合的两 
名飞行员，其中 i 名是英国飞行员， >) 1名是外籍飞行员 c 在众多的飞行员屮.每一名外籍6 
行员都可以与其他若干名英国飞行员很好地配合 。 如何选择配对6行的 K 行员才能使一次派 
出最多的飞机。对于给定的外籍飞行员与英闻飞行员的配合情况，试设汁一个算法找出最佳 
飞行员配对方案，使皇家空军一次能派出最多的匕机 r 

8-11 太空飞行计划问题『教授正在为国家航天中心计划一系列的太空飞行。每次 
太空飞行可进行一系列商业性实验而获取利润。现已确定: T 一个可供选择的实验集合 
E =\ E ] i E 2 r -, E n \ 和进行这些实验需要使用的全部仪器的集合/=丨 / i ，/ 2 1。实验 

&需要用到的仪器是/的子集配置仪器 A 的费用为 q 美元。实验 &的 赞助商已同意 
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为该实验支付 h 美元。 W 教授的仟务是找出•个有效算法，确定在一次太空飞行中要进行 
哪些实验并因此而配置哪跑仪器才能使太空飞行的净收益最大这 M 净收益是指进行实验所 
获得的全部收入与配置仪器的全部费用的差额。 

8-12 设 G = ( V '， 幻是源为、 s ， 汇为/，且容量均为整数的一个流网络。已知/是 G 的一 
个最大流。 

(1) 假设一条边 U ， vKE 的容量增1，试设计--个在0 ( m +丨£丨 ） 时间内更新最大流 
/的 算法。 

(2) 假设一条边的容 ffl 减1，试设计一个在 0(1 V I +丨五丨）时间内更新最大流 
/的算法。 

8-13 最小路径覆盖问题。给定有向图 0 = ( V , E ) 0 设户是 G 的一个简单路(顶点不 
相交)的集合。如果 V 屮每个顶点恰好在 P 的一条路上，则称/>是(；的一个路径覆盖。户中 
路径可以从 K 的任何一个顶点开始，长度也是任意的，特别地,可以为0。 G 的最小路径覆盖 
是 C 的所含路径条数最少的路径覆盖。 

设计一个有效算法求一个有向无环图^的最小路径覆盖。 

.[提示:设 F = il ，2,…， M ，如下构造网络 G 1 = ( Vl y E \) 

FI = U 0 ，〜，“％〜 iUiy 0 ， yi ，"，， y n l 

£1 = i ( x ^ yXi ) 1 V \ U ! ( y » jyo ) ^ ^ V \ ( xi ， yj)\(i t j )^： E \ 

求网络 G 1 的最大流。] 

8-14 魔术球问题。假设有 n 根柱子，现要 按下述 规则在这《根柱子中依次放入编号为 
1,2,3,…的球。 

(1) 每次只能在某根柱子的最上面放球。 

(2) 在同一根柱子中，任何两个相邻球的编号之和为完全平方数。 

试设计一个算法，计算出在 / T 根柱子上最多能放多少个球。例如，在4根柱子上最多可 
放11个球。 

8-15 圆桌问题。假设有来自/ I 个不 N 单位的代表参加一次国际会议。每个单位的代 
表数分别为 n 」= l ,2, …，〜 会议餐厅共有 m 张餐桌，每张餐桌可容纳以纟=1，2,…， m ) 
个代表就餐。为了使代表们充分交流，希望从同一个单位来的代表不在同一个餐桌就餐。试 
设计一个算法，给出满足要求的代表就餐方案。 

8-16 混合图欧拉回路问题。试设计一个找混合图(既有无向边也有有向边的图）的欧拉 
回路的有效算法。 

8-17 最长递增子序列问题。给定正整数序列以，^，…，&，要求 

(1) 计算其最长递增子序列的长度 s 。 

(2) 设计一个有效算法，计算从给定的序列中最多吋取出多少个长度为 s 的递增子序列。 

8-18 试题库问题：假设一个试题库中有〃道试题，每道试题都标明了所属类别,同一道 

题可能有多个类别属性。现要从题库中柚取100道题组成试卷，并要求试卷包含20类不同类 
型的试题。试设计一个满足要求的组卷算法。 

849机器人路径规划问题。假设机器入可在一个树状路径上自由移动。给定起点 s 和 
终点 h 机器人要从$运动到 L 树状路径上有若干可移动的障碍物。由于路径狭窄，任何时刻 
在路径的任何位置不能同时容纳两个物体。每一步可以将障碍物或机器人移到相邻的空结点 
上。设计一个有效算法用最少移动次数使机器人从 s 运动到 L 
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8-20 方格取数问题 ^ 在一个侖 n 个方格的棋盘中，每个方格中有一个正幣数。现要从 
方格中取数，使任意两个数所在方格没有公共边，且取出的数的总和最大。试设计一个满足要 
求的取数算法. 

8-21 餐巾计划问题,.一个餐厅在相继的 A 天里 ，每天需用的餐巾 数+尽 相同。假设第 
f 天需要〜块餐巾 （i = 〖，2, …， A 0。 餐厅可以购 久:新 的餐巾，每块餐巾的费用为 y 分; 或者把 
旧餐巾送到快洗部，洗一块需 m 天，其费用为/ 分; 或者送到慢洗部，洗一块需; I 天> m )， 
其费用为6 </分。每天结束时，餐厅必须决定将多少块脏的餐巾送到快洗部，多少块餐巾送 
到慢洗部，以及多少块保存起来延期送洗。但是每天洗好的餐巾和购买的新餐巾数之和要满 
足当天的需求量，试设计一个算法为餐厅合理地安排好/ V 大中餐巾的使用计划，使总的花费 
最小。 

8-22 试将单源最短路问题表示为一个最小费用流问题。 

8-23 试用最小费用流算法解中国邮路问题。 

8-24 航空路线问题。给定一张航空图，图中顶点代表城市，边代表两城巾间的直通航 
线。现要求找出一条满足下述限制条件的且途经城市最多的旅行 路线： 

(1) 从最西端城市出发，单向从西向东途经若十城市到达最东端城市，然后再单向从东向 
西飞回起点（可途经若十城市）。 

(2) 除起点城市外，任何城市只能访问1次。 

对于给定的航空图，试设计一个算法找出一条满足要求的最佳航空路线。 

8-25 软件补丁问题。 r 公司发现其研制的一个软件中有^个错误，随即为该软件发放 
了 -- 批共 m 个补丁程序。每一个补丁程序都有其特定的适用环境，某个补丁只仃在钦件中包 
含某些错误而同时又不包含另 一 些错误时才可以使用 。一 个补丁在棑除某些错误的同时，往 
往会加人另一些错误。换句话说，对于每一个补 ri , 都有两个与之相应的错误集合 / n :(] 和 
使得仅当软件包含 Fl [ i ] 中的所有错误，而不包含屮的任何错误时，才可以使 
用补丁 补丁 /将修复软件中的某些错误而同时加人另-些错误 f 7[〖]。 另外，每 

个补丁都耗费一定的时间。 

试设计一个算法，利用7公司提供的 m 个补丁程序将原软件修复成一个没有错误的软 
件，并使修复后的软件耗时最少。 

8-26 星际转移问题。由于人类对自然资源的消耗，人们意识到大约在2300年之后，地 
球就不能再居住了，于足在月球上建立了新的绿地，以便在耑要时移民。4人意想不到的是， 
2177年冬由于末知的原因，地球环境发少.了连锁崩溃，人类必须在最短的时 N 内迁往月球。 
现有 n 个太空站位于地球与月球之间，且有 m 艘公共交通太空船在其间来回穿梭。每个太 
空站可容纳无限多的人，而每艘太空船；只可容纳 //= i ] 个人。每艘太空船将周期性地停靠一 
系列的太空站，例如，（1，3,4)表示该太空船将周期性地停靠太空站134134134每…艘太 
空船从一个太空站驶往任一太空站耗时均为 U 人们只能在太空船停靠太空站（或月球、地 
球)时上、下船。初始时所有人全在地球上，太空船全在初始站。试设计一个算法，找出让所有 
人尽快全部转移到月球上的运输方案。 

8-27 孤岛营救问题。1944年，持种兵麦克接到国防部的命令，要求立即赶赴太平洋上 
的一个孤岛，营救被敌军俘虏的大兵瑞恩。瑞恩被关押在一个迷宫里，迷宫地形复杂，但幸好 
麦克得到了迷宫的地形图 c 迷宮的外形是一个长方形，其南北方向被划分为 A 行，东西方向 
被划分为 M 列，于是整个迷宫被划分为 iVx M 个单元。每一个单元的位置可用一个有序数 
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对(单元的行兮，单兀的列号)来表 7 K . 南北或东西方叫相邻的2个单元之间可能互通，也可能 
有一扇锁着的门，或者是一堵不吋逾越的墙。迷宫中有一些笮元存放着钥匙， - 并且所有的门被 
分成/^类，打幵同…类门的钥匙相同，打开不 IH ] 类门的钥匙不同。 

大兵瑞恩被关押在迷宫的东南角，即 （ A 、 M ) 单元里，并已经昏迷。迷公只有一个入口，在 
西北角。也就是说，麦克可以直接进人(1，1)单元。另外，灰克从一个单元移动到另一个相邻 
单元的时间为1，拿取所在单元钥匙的时间及用钥匙幵门的时间可忽略不计。 

试设计一个算法，帮助麦克以最快的方式到达瑞恩所在单元，营救大兵瑞恩。 

8-28 汽车加油行驶问题。给定一个 /Vx A 7 的交通方形网格，设其左上角为起点◎，坐 
标为 (1，1)， X 轴向右为正， F 轴向下为正，每个方格边长为〗，如图 8-10 所示。一辆汽车从起 
点◎出发驶向右下角终点▲，其坐标为 （ W ，/ V )。 在若十个网格交叉点处，设置了油库，可供汽 
车在行驶途中加油。汽车在行驶过程中应遵守如下规则： 

(1) 汽车只能沿网格边行驶，装满油后能行驶 K 条网格边。出发时汽车已装满油，在起 
点与终点处不设油库。 

(2) 当汽车行驶经过一条网格边时，若其 A ： 轴坐标或^铀坐标减小，则应付费用否则 
免付费用。 

(3) 汽车在行驶过程中遇油库，成加满油并付加油费用4 

(4) 在需要时可在网格点处增设油库，并付增设油库费用 C (不含加油费用4夂 

(5) ⑴〜 （4) 中的各数斤，尺，允丹，(：均为正整数，且满足约束 : 2 矣；\^100, 2 矣/^10 0 

设计一个算法，求出汽车从起点出发到达终点的一条所付费用最少的行驶路线。 



图8-〖0夂通方形网格示例 



第 9 章 NP 完全性理论与近似算法 


学习要点 

• 理解 RAM,RASP 和图灵机计算模型 
• 理解非确定性图灵机的概念 
• 理解 P 类与 NP 类语言的概念 
- 理解 NP 完全问题的概念 

• 理解近似算法的性能比及多项式时间近似格式的概念 
• 通过下面的范例学习 NP 完全问题的近似算法： 

(1) 顶点覆盖问题 

(2) 旅行售货员问题 

(3) 集合覆盖问题 

(4) 子集和问题 


在计算机算法理论中，最深刻的问题之一是 :从计 算的观点来看，我们要解决的问题的内 
在复杂性如何，它是“易”计算的还是“难”计算的。如果我们知道了一个问题的计算时间下界， 
我们就可以较正确地评价解决该问题的各种算法的效率，进而确定对已有算法还有多少改进 
的余地。在许多情况下，要确定一个问题的内在计算复杂性是很困难的。 [1 创造出的各种分 
析问题计算复杂性的方法和工具，可以较准确地确定许多问题的计算复杂性. 

问题的计算复杂性可以通过解决该问题所需计算量的多少来度量。如何区分一个问题是 
“易”还是“难”呢？人们通常将可在多项式时间内解决的问题看作是“易”解问题，而将需要指 
数函数时间解决的问题看作是“难”问题。这里所说的多项式时间和指数函数时间是针对问题 
的规模而言的，即解决问题所需的时间是问题规模的多项式还是指数函数。对于实际遇到的 
许多问题，人们至今尤法确切地了解其内在的计算复杂性。闪此只能用分类的方法将计算复 
杂性大致相同的问题归类进行研究.而对于能够进行较彻底分析的问题则尽可能准确地确定 
其计算复杂性，从而获得对它的深刻理解。 

9.1 计算模型 

在进行问题的计算复杂性分析之骱， f 先必须建立求解问题所用的计算模型,包括定义该计 
算模型中所用的基本运算，其 U 的是为了使问题的计算复杂性分析有一个共同的客观尺度。 

本节要讨论几个基本的计算模型。其中最重要的3个计算模型是随机存取机 RAM ( Ran ¬ 
dom Access Machine )、 随机存取存储程序机 RASF(Random Access Stored Program Machine ) 以 

及图灵机 (Turing Machine ), 这 3 个计算模型在计算能力上是等价的，但计算速度不同。 

9.1.1 随机存取机 RAM 

随机存取机 RAM 所描述的形式计算机是一台单累加器计算机。它不允许程序修改其自 
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RAM 巾只读输人带、只写输出带、程序存储部件、内存储器和指令计数器 5 个部分组成。 
其屮，内存储器中的0号寄存器用作累加器。 

HAM 的结构如图 9-1 所 



图随机存取机 RAM 

只读输人带由- ■系 列方格组成，每格可存放一 个整数 （可为负）。从只读输人带读取一个 
数后，读写头向右移动一格。只写输出带的每个方格初始时为空。.每执行一条写指令就在读 
写头下的方格屮打印出一个整数，然后读写头右移一格。输出的符号一经写出，不能再修改。 

内存储器由一系列寄存器 q ，…， q ，…组成。每个寄存器可以存放一个任意大小的整 
数。内存中寄存器的个数不受限制，也就是说，在程序中可以使用任意多个寄存器。这是 
RAM 计算模型对现实计算机的一种抽象与简化 2 当所求解的问题规模不超过一台计算机的 
内存容量，且在计算屮所出现的整数字长不超过计算机字长时，这种抽象是符合实际的。 

HAM 程序不是#放在内存储器中,因而程序不能修改其自身。程序是一个带标号的指令 
序列。与现实计算机中所用的指令相仿， RAM 设有箅术运算指令、输人输出指令、存取数指令 
及转移指令。 RAM 中有直接寻址和间接寻址两种基本寻址方式 3 所有的计算在累加器中 
进行。 r D 像其他寄存器一样，能容纳一个任意大小的整数。每条 RAM 指令由操作码和操作 
数两部分组成。其中操作数有以下3种 形式： 

(1) 操作数是整数（本身(直接数型)。 

(2) 纟，/是一非负整数，操作数是寄存器「;的内容(直接地址型 h 

(3) * 为非负整数，若寄存器~的内容为整数 ； ，则操作数为寄存器~.中的内容。当 
j 为负整数时操作数无定义(间接地址型）。 

RAM 对所有 X 定义的指令作停机处理 c 

设 C 是内存映射函数，即表示寄存器 h 中的内容。以上3种类型的操作数的值 F 
分别为: V ( = i ) = i , V ( i ) - c ( i)y V ( * i ) = c ( c ( i))o 

RAM 的基本指令集如表 9-1 所 

在 RAM 程序中，每执行过指令集中前8种指令之一后，指令计数器的值增1。因此， 
RAM 程序中的指令是被顺序执行的，直至遇到指令集中后4种指令。 JUMP 指令使程序无条 
件转移到标号所指指令处继续执行。 JCTZ 指令在累加器中内容大于零时跳转，而 JZERO 指 
令在累加器屮内容为零时跳转。 

总的来讲，一个 KAM 程序定义了从输人带到输出带的一个映射。我们可以对这种映射 
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关系作 不问的 解释。常用的两个重要的解释是将这种映射 Xl 系看成是计算一个函数，或看成 
是接受-种语宵。 


表>1 RAM 基本指令集 


操作码 ^ 

操作数 

指令含义 

(1) LOAD ! 

一 

= i/i/ ^ i 

取操作数人累加器 

(2) STORE : 

,■■ 

i i/* i 

将累加器中数存人内存 

(3) ADD 1 

: :i/i/ * i 

加法运算 

(4) SUB 

; =i/i/* i 

减法运算 

(5) MULT 

l - 

! = i/i" i 

乘法运算 

(6) DIV 

^ i/i/ ^ i 

除法运算 

(7) READ 

£/* i 

读人 

(8) WRITE 

= i/i/^ i 

输出 

(9) JUMP 

标号 

无条件转移到标号语句 

(10) JCT2 


止转移到标号语句 

(11) JZERO 

标号 

零转移到标号语句 

(12) HALT j 

停机 


如果一个 RAM 程序 P 总是从输人带前 n 个方格中读入 n 个整数…，、，并旦在 


输出带的第一个方格上输出一个整数 y 后停机，那么就说程序 P 计算了函数 

f(xiyX 2 y ,t ', X n ) ^ y 


对 RAM 程序的另一种解释是把它当作一个语言接受器。一个字母表是符兮的有限集 


合，而语言是字母表上字符串的集合。字母表中的符号可以用整数〗，2,…4来表示 。 RAM 


能以如下方式接受语 


将字符串 S = ai a 2 放在输入带上，在输人带的第1个方格中放人符号第2个方 
格中放人符号 a 2 ，…，第 n 个方格中放人符号〜。然后在第 /1 + 1 个方格中放入0,作为输人 
串的结束标志符。如果一个 RAM 程序 P 读了字符串 S 及结朿标志符0后,在输出带的第1 


格输出一个1并停机，就说程序 P 接受了字符串心 

P 可接受的语言 L 是 P 可接受的所有字符串的集合。对于不在 P 可接受的语言 L 中的 
输人串，程序 P 在输出带上输出一个不同于1的符号并停机，或者程序 P 水远不停机。 

在 RAM 计算模型下，要精确地计算一个算法的时间和空间复杂性，就必须知道执行每条 
RAM 指令所需的时间及每个寄存器实际所占的空间。在此，要讨论两种 RAM 程序的耗费标 


准:均勻耗费标准和对数耗费标准。 

在均勻耗费标准下，每条 RAM 指令需要一个单位时间，每个寄存器 占用一 个单位空间， 
以后除特别注明外， RAM 程序的复杂性将按照均匀耗费标准来 衡量。 

对数耗费标准是基于这样的假定，即执行一条指令的耗费与以二进制表不的指令操作数 
长度成比例。在 RAM 计算模型下，假定一个寄存器可存放一个任意大小的 整数。 若设 Ki ) 
是整数/所占的二进制位数，则 


/(£•) = 


r Liogl/iJ 


i^O 

t = 0 


各 KAM 指令的对数耗费如表 9-2 所示。 

表9_2 RAM 指令的对数耗费 


RAM 指令 

对数耗费 

(1) LOAD « 

f( a) 

(2) STORE i 

/(^{o)) + /(0 
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续表 


RAM 指令 

对数粍费 

STORK ， i 

H^(0)) + i(z) + 

(3) ADD « 

/(c(0)) + Ka) 

⑷ SUB a 

Kr ⑻） + t(a) 

(5) MULT a 

/(c(0)) + K«) 

(6) D1V a 

Ut ； (0)) + i(a) 

(7) READ l 

1( input) + /( i) 

READ ^ i 

l(input) + /(f) + i{ c{i)) 

(8) WRITE a 

l(a) 

(9) JUMP b 

1 

(10) JGTZ b 

1( HO)) 

(11) JZERO b 

/(c{0)) 

(12) HALT 

1 


其中，《表示操作数 d U ) 表示操作数 U 相应的耗费，6表示标号。 
对于前述3种类型的操作数，相应的对数耗费如表 9-3 所示。 

表 9-3 与3种类型操作数相应的对数耗费 


操作数 A 

对数耗费 tU) 

s 

=l 

Hi) 

• 

l 

/ “） + /{ c( 0) 

* i 

Ki) + + l{c(c(i))) 


9.1.2 随机存取存储程序机 RASP 


由于 RAM 程序不是存储在 RAM 的存储器中，因而程序不能修改其自身。而随机存取存储 
程序机 RASP 计算模型，除了程序存储在存储器中并能修改其自身外，其他方面与 RAM 相似。 

在 RASP 指令集中，由于不需要间接寻址，因而不允许使用间接地址。其余指令与 RAM 
指令集一样。稍后我们会看到在程序执行过程中， RASP 可通过修改指令来模拟间接寻址。 

RASP 的整体结构类似于 RAM, 所不同的是 RASP 的程序是存储在寄存器中的。每条 
RASP 指令占据两个连续的寄存器。第1个寄存器存放操作码的编码，第2个寄存器存放地 
址。 RASP 指令用整数进行编码 e 表 9-4 是 R4SP 指令集中各指令的编码。 


表 SM RASP 指令编码 


指 令 

编 码 

指令 ! 

编 码 

LOAD / 

1 

D1V i 

10 

LOAD = i 

2 

mv = i ! 

1 

11 

STORE i 

• 

3 

KFAD i 

12 

ADD i 

4 

WRITE i \ 

i 13 

ADD = ^ 

5 

WTITE ^ i 14 

SUB . 

6 

JUMP i ! 15 

SUB = i 

7 

JGT2 i 

16 

MUI.T i 

8 

JZERO i 

17 

MULT = i 

9 

: HALT 

18 


开始时, RASP 程序装在存储器中，指令 U 数器设定在某个指定的寄存器上。寄存器中存 
储着操作码的编码除转移指令外，每条指令执行后，指令计数器增加2。当遇到 JUMP 〖(无 
条件转移）, jGTZ i (当累加器中内容为止时转移)或 JZKKO j (当累加器中内容为0时转移) 
指令时，指令计数器置为纟。这些指令的效果与相应的 RAM 指令相同。 
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4 IUM 程序类似，对于•个 RASP 程序，可在均匀耗费准下或在对数耗费标准下米考 
虑其计算复杂性。在均匀耗费标准下， RASP 的计算复杂性与 HAM 相同。在对数耗费标准 
下， RASP 不仅要支付 i | 算操作数的耗费，而巨要支付存取指令木身的耗费存取的耗费足 
/( LC)cLC 是指令计数器中的内容。例如，执行存储在寄存器 y 和/ + 1中的指令 ADI ) i 的对 
数耗费足 /(j + KHO )) 十 /( i )。 执行存储在寄存器 ） 和_/+ 1中的指令 ADD = /的对数耗费 
是 Ky )+ i ( c (0)) + Ki ) + Kc (0) o 严格地讲，还应加上-项 + 〗），但这只差一个常数因 
子。今后我们只关心数量级，而对常数因子一般不予考虑 U 

解决同一问题的 RAM 程序和 RASP 程序有多大差别呢？实际上，斗;管是在均匀耗费标 
准 F ， 还是在对数耗费标准下， KAM 程序和 RASP 稈序的复杂性只差一个常数因子 c 在一个 
汁算模 型下， FU ) 时间内完成的输入-输出映射可在另-♦个计算模型下模拟，并在 kT(nm 
间内完成。其屮4朵一个常数闪了。空间复杂性的情况也是类似的。 


9.1.3 图灵机 


图灵机是一个结构简单且计算能力很强的计算模型。 

一台多带图灵机兑由一个有限状态控制器和 A 条读写带 U >1) 组成的。这些读写带的 
右端无限，每条带都从左到右划分为方格，每个方格可以存放一个带符每。带符的总数是有 


限的。每条带 t 都有一个由有限状态控制器 
操纵的读写头或称为带头，它可以对这 &条带 
进行读写操作。有限状态控制器在某一时刻 
处于某种状态，且状态总数是有限的、图 9-2 
是多带图灵机的示意图。 

根据有限状态控制器的当前状态及每个 
渎写头渎到的带符号，图炅机的•个计算步可 
实现下面3个操作之一或全部。 

(1) 改变有限状态控制器中的状态。 

(2) 清除当前读写头下的方格中原有带 
符号并写上新的带符兮。 


有限状态 
控制器 




厂 



带1 II ，”… 






带 2 i 1 …一 I ……! 



带灸 


图 9-2 多带囝炅机 


(3) 独立地将任何一个或所有读写头，向左移动一个方格 （ L ) 或向右移动•个方格 ( R ) 或 
停在当前笮元不动 ( S )。 


灸带图灵机可以形式化地描述为一个7兀组（（>， 

(1) <?足有限个状态的集合。 

(2) r 是有限个带符号的集合。 

0) /是输入符号的集合， /£ r . 

(4) 6是惟••的空白符，6€ T - h 

(5) 是初始状态。 

(6) 7/ 是终止(或接受)状态、、 

(7) 占是移动函数。它是从 （> x 户的某一子集映射到 （? x(rx 的函数。 

对于某个包含一个状态及 A 个带符号的 A + 1元组，移动函数将给出-个新的状态和 i 

个序偶，每个序偶由一个新的带符号及读写头的移动方向组成。形式上可表述为 
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当图灵机处于状态 g 且对一切1矣纟矣/:，第丨条带的读写头扫描着的当前方格中的符号 
正好是 A 时，图灵机就按这个移动函数所规定的内容进行工作： 

(1) 将图灵机的当前状态 ？ 改为状态 〆 。 

(2) 把第 f 条读写头下当前方格中的符号〜清除并写上新的带符 一 

(3) 按 < 指出的方向移动各带的读写头。这里4 =匕表示读写头左移一格，4 = R 表示 
读写头右移 一 格， d t = S 表示读写头 不动。 

一 台图灵机可用来识别 s ^ r 。 一 台图灵机的带符号集 应当 包括这个语言的字母表中 
的全体符号和一个空白符纟，也许还有其他符号。开始时，第一条带上放有一个输入符号串， 
从最左的方格起每格放一个输入符号。这条带卜.其余方格都是空白。其他各带上也全是空 
白。 所有读写头都处在各带左端的第一个方格上 。 当 a 仅当图灵机从指定的初始状态仰开 
始，经过一系列计算步后，最终进入终止状态(或接受状态）办时，称图灵机接受这个输人符号 
串。这台图灵机所能接受的所有输入符 y - 串的集合，称作这台图灵机识别的一个语言。 

与 RAM 模型类似，图灵机既可作为语言接受器，也可作为计算函数的装置。函数的自变 
量可编码成一字符串输入到一条输入带上，用一特殊符号#来隔开这些自变量。若图灵机经 
过有限步计算后，在一条指定的带上输出整数: r 并停机，则町以说图灵机计算出了 /(幻= 7。 
由此可见，计算一个函数的过程与接受一个语言的过程没有什么区别。 

图灵机 m 的时间复杂性 r (幻是它处理所有长度为 n 的输人所需的最大计算步数。如 
果对某个长度为/ I 的输入，图灵机不停机， ru ) 对这个 a 值无定义。图灵机的空间复杂性 
5(71) 是它处理所有长度为找的输入时 ，在& 条带上所使用过的方格数的总和。如果某个读 
写头无限地向右移动而不停机 ， s ( n ) 也无定义。 

9.2 P 类与 NP 类问题 

本书的许多算法都是多项式时间算法，即对规模为„的输人，算法在最坏情况下的计算 
时间为 0 U A )4 为一个常数。是否所有的问题都在多项式时间内可解呢？回答是否定的。 
例如，存在一些不可解问题，如著名的“图灵停机问题”，任何计算机不论耗费多少时间也不能 
解该问题。此外，还有一些问题，虽然可以用计算机求解，但是对任意常数 I 它们都不能在 
0{ n k )时间内得到解答 ◦一 般地,将可由多项式时间算法求解的问题看作是易处理的问题，而 
将需要超多项式时间才能求解的问题看作是难处理的问题。有许多问题，从表面上看似乎并 
不比排序或图的搜索等问题更困难，然而至今入们还没有找到解决这些问题的多项式时间算 
法，也没有入能够证明这些问题需要超多项 式时间 下界。也就是说，在图灵机计算模型下，这 
类问题的计算复杂性至今未知。为了研究这类问题的计算复杂性，人们提出了另一个能力更 
强的计算模型，即非确定性图灵机计算模型， 简记为 NDTM ( Nondaterministic Turing 

Machine )。 在这个计算模型下，许多问题就可以在多项式时间内求解。 

9.2.1 非确定性图灵机 

在 9.1 节中介绍的图灵机计算模型中，移动函数5是单值的，即对于9 x 尸中的每一个 
值，当它属于5的定义域时，(？ x ( TxlL ^ R . Siy 中只有惟一的一个值与之对应。为了区别 
起见，称这种图灵机为确定性图灵机，简记为 DTM(Deterministic Turing Machine ) o 

一个 it 带的非确定件图炅机 M 也是一个7元组： （(> ， T ，/，3乃，仰， ？/ )。与确定性图灵 

. 298 • 



机不同的是，非确定性图灵机允许3具有不确定性，即对于中的付一个值 
…， M ), 当它属于5的定义域时， （) x(rx IL ， R ， Si ) k 中有惟一的•个 f 集 ( Kg ，…， 
与之 对应。 我 们吋以在^心 a . ^，…，^)中随意选定一个值作为它的函数值。这个不 
确定的函数5仍称为移动函数。 

k 带非确定性图灵机的瞬像与 / c 带确定性图灵机的瞬像一样定义 /(：： 是一个 A 元组（^, 
M ，…， q ) 。其中 ，化 是形如 My 的符号串。设非确定性阁灵机 m = ((? ， r ，/， n 仰， V )正 
处于状态心且第；个读写头（ t ) 正扫描着第 / 条带上冇符 V \ 的方格。若有 （ r ，（ Yl , 
Di ) ，… T ( h ， At ))€ 5(9, h ， X 2 , …， X A ) ，则说表达 ( q ， AC ! ，％2,…，〜〉的瞬像 （ C 为 fi ) 与表达 
( r ，（》 ZM ， …，（，仏）)产生的瞬像(记为 C ) 之间有关系 KM ), 记为万 [~( M ) C (在不引 
起混淆时可略去 （ A /))。 

如果对于每一个输入度为 n 的可接受输人串，接受该输入串的北确定性图灵机 M 的计 
算路径长至多为 rU )， 则称 m 的时间复杂性是 ru )。 如果有某个导致接受状态的动作序列， 
在这个序列中，每一条带上至多扫描了 5(71) 个不同的方格，则称 M 的空间复杂性为 SU )。 

如前所述，确定性和非确定性图灵机 的区别 就在于，确定性图灵机的每一步只有一种选 
择，而非确定性图灵机却可以有多种选择。由此可见，非确定性阁灵机的 U 算能力比确定性图 
灵机的计算能力强得多。对于一台时间复杂性为 r (/0 的非确定性图灵机，可以沔一台时间 
复杂性为卩的确定性图灵机来模拟，其中 c 为一常数。这就是说，如果 r (〃) 是一个 
合理的时间复杂性函数， m 是一台时间复杂性为 ru ) 的非确定性图灵机，可以找到一个常数 
C 和一台确定性图灵机 AT ， 使得它们可接受的语言相同 ， R AT 的时间复杂性为 

9.2.2 P 类与 NP 类语言 

现在定义两个重要的语#类 P 和 NP 如下： 

P = UIL 是一个能在多项式时间内被一台 DTM 所接受的语言； 

NP = UIL 是一个能在多项式时间内被一台 NDTM 所接受的语言 | 

由于一台确定性图灵机可看作是非确定性图灵机的特例，所以可在多项式时间内被确定 
性图灵机接受的语言也可在多项式时间内被非确定性图灵机接受，故 P CNP , 

虽然/>和 NP 是借助图灵机来定义的,但也町以用其他计算模型来定义这两个语言类。 
直观上可以认为/>是在多项式时间内的可识别的语言类。例如，在对数耗费标准下，如果图 
灵机接受语言 L 的时间复杂性为 rU ), 则 RAM 或 RASP 接受语言 L 的时间复杂性介于 
fciTU ) 和 fc 2 ： T 4 U ) 之间，其中 h 和4 2 都是正的常数。因此，/,€/>当且仅当在 RAM 或 

RASP 计算模型下存在接受语言 L 的多项式时间算法。 

另一方面，若在 RAM 或 RASP 的指令系统上添加一条非确定性选择 指令： 

CHOICEU ^ L 2 ,-, L fr ) 

也可以定义非确定性的 RAM 或 RASP 计算模型、 CHOICE 指令非确定性地选出并执行标号 
为 LA ，…， L k 的某个语句 u 因此，在对数耗费标准下，也可以用非确定性 KAM 或 RASP 
模型来定义 NP 类。在该计算模型下，接受语言 L 的算法，称为非确定性算法。一个非确定 
性算法接受语 M 当&仅当对每一个 xG L ， 在该算法中存在一条接受 x 的计算路径。该算 
法的计算时间复杂性 T (幻就定义为，对所有长度为《的可接受输入串，其最短计算路径 K 度 
的最大值。因此，在非确定性 RAM 或 RASP 计算模型下， NP 类 语言吋 定义为 
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NP = L 是--个能在多项式时间内被一个非确定性 RAM 或 HASP 下算法所接受的语言 i 

下面考察 NP 类奶&的一个例子，即无叫阁的团问题。该问题的输入是 - 个有〃个顶点 
的无向图6’ = (1/，£：)和一个整数1要求判定图 G 是否包含一个&顶点的完全子图（闭），即 
判定是否存在 rc VJ r I = A ， 且对于所有的 IX， rt V，, 有 （ u ， v )& f ：。 

若用邻接矩阵来表示图 C ， 用二进制串表示锒数 I 则团问 题的一个实例可以用长度为 
+ lugfe + 1的二进位串表示。因此, R 1 问题可表示为语言 

CL 1 QUE = ! w # t:l 泌， <|0，1丨 * ， 以记为邻接矩阵的图 G 有- ♦个 / c 顶点的团， 

t 1 是&的二进制去示 i 

接受该语言 CLIQUE 的非确定性算法如下 t 宫先用非确定性选择指令选出包含&个顶点 
的候选顶点子集 V ，然后确定性地检查该子集是否是闭问题的一个解。算法分为3个阶段。 

笫1阶段将输入串 W 林 V 分解，并汁算出 a = ，以及用 V 忐示的整数幻若输人不 

具有形式 w t •或1 不是一个平方数就拒绝该输人。显而 M 见，第1阶段可在0(/1 2 )时间 

内完成3 

在第2阶段屮，非确定性地选择 W 的一 个&元 T 集 V f C Vo 用一位向量 A [ l :/1] 来表示 
该子集。 A 中恰有 &个〗 ，即 A [纟]=1 3且仅当 V '非确定性选择算法 如下： 

int j = 0; 

for (int i = l ; i < = n ; i + + ) i 
int m = Choice ( 0,1); 

switoh ( m ) 

\ case 0: A J ] = 0; hreak ; 
case 1 : A[iJ = l ; j + + ; break ; 

I 

• 

I 

I 

if ( j ! = k ) reject ; 

r • • • % - - - ' ' * * r 

该算法产生 K 的一个 A 元子集 V "，它的计算时间显然为 OU )。 因此，算法在第 2 阶段 
耗时 0 U )。 

第3阶段是确定性地检查 V ”的团性质。若 F 是一个团则接受输入，否则拒绝输人。这 
显然可以在0( 〆 )时间内完成。因此，整个算法的时间复杂性为 0( n 4 )。 

若图 G ^( V t E ) 不包含 一个& 团，则在算法的笫 2 阶段产生的任何 A 元子集 r 不具有 
团性质。因此，算法没有导致接受状态的计算路径。反之，若图 G 含有一 个&团 >"，则算法的 
第2阶段中有一个计算路径产生 T ，使得在算法的第3阶段导致接受状态。 

综上即知，所述非确定性算法在多项式时间内接受语言 CLIQUE ， 即 CLIQUEC - NP . 

9.2.3 多项式时间验证 

在识别语 H CLIQUE 的非确定性算法中，算法的第2阶段是非确定性的且牦时 0(n) 0 
整个算法的计算时间复杂性主要取决于第3阶段的验证算法，即给定了图 G 的一个 A 团猜测 
T ， 验证它是否确是一个团 u 若验证部分4在多项式时间内完成，则整个非确定性算法具备 
多项式时间复杂性，因而所识别的语言为 NP 类语言。这是识別 NP 类语言的非确定性算法 
所具有的一般特性。因此，我们也叫以将 NP 类语言看作是在确定性计算模型下多项式时间 
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可验证的语言戈。将验证算法定义为两个6 变错 的算法 A， 其中一个 D 变通常的输人串 
X，另一个6变贵是一个称为“证书”的二进制串 y 、、 如果对任意串存在…个>, 
并且 a 可以用 r 来证明则算法 a 就验证丫语 g 例如，在团问题中，证书是图 g 
屮一个 A 团，它提供了足够的倍息供算法 A (第3阶段的算法）在多项式时 N 内验证语 g 
CLIQUE. 因此，语言 CLIQUE 是多项式时间可验证语言。…般地，多项式吋间町验证语言 
类 VP 吋定义为 

vp = i / jags % i : 为一有限字符集， ir 足 s 中字符构成的字符串的全体，存在一个多 
项式/ >和一个多项式时间验证算法 au ， y )， 使得对任意 xe wxe /. ，且仅当存在 

rey，i n 彡 〆 mm au ， v) = is 

定理 9-1 VP= NP C 

证明: 先证明 VPCNP , 对于任意 LG VP , 设 P 是一个多项式， A 是-个多项式时间验 
证算法，则下面的非确定性算法接受语言 

U ) 对于输人义，非确定性地产生一字符串； 

(2) 当 AU ， 10 = 1时接受 

该算法的步骤 U ) 与团问题的第2阶段的非确定性算法〜样，至多在 0( m ) 时间内完 
成。步骤 (2) 的计算时间是 U 1 和 j 的多项式，而 I Y\^p(\X\) v 因此.它也是 I XI 的多项 
式。整个算法可在多项式时间内完成。因此， L 6 NP 。 由此可见 VPGNK 

反之，设非确定性图灵机 M 在多项式时间 p 内接受语言设 M 
在任何情况下只有不超过 d 个的下-动作选择，则对于输人串 X,M 的任一动作序列可用10, 
1，〜川-1丨的长度不超过 P (l AI ) 的字符串来编码。+失一般性，设 1 X 1 验证算法 

AU , H 用于验证“ F 是 M 上关于输人 I 的一条接受计算路径的编码”。即当 [ 是这样一个 
编码时， AU ， r ) = 1。 A ( J ， H 显然可在多项式时间内确定性地进行验证，且 

尤二 UI 存在 F 使得 I Y\^p(\X\)a.MX f Y) = )\ 

因此 LfVP 。 由此可知 VP 2 NK 
综上即知， VP=NP 。 

9.3 NP 完全问题 

从 P 类和 NP 类语言的定义，我们已知道尸 SNP。 直观上看， P 类问题是确定性计算模 
型下的易解问题类，而 NP 类问题是非确定性计算模型下的易验证问题类.在通常清况 F， 解 
一个问题要比验证问题的一个解困难得多，特别在有时间限制的条件下史是如此。因此，大多 
数的计算机科学家认为 INP 类中包含 T 不属于 P 类的语言，即尸一 NP。 但这个问题至今没有 
获得明确的解答。也许使大多数计算机科学家相信 P_NP 的最令人信服的理由是存在一类 
NP 完全问题。这类问题有一种令人惊奇的性质，即如果〜个 NP 完全问题能在多项式时间内 
得到解决，那么 NP 中的每一个问题都可以在多项式时间内求解，即 \P f . 尽管已进行了 
多年的研究，目前还没 有一个 NP 完全问题有多项式时间算法 

9.3.1 多项式时间变换 

设 h c ^： r ,/ J2 是两个语言。所谓语言心能在多项式时间内变换为沿 w (简 

记为 z t oc / 2 ) 是指存在映射 /； vr -^ ，且/ 满足： 
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(0 有一个计算/的多项式吋间确定性图 义机； 

(2) 对于任意的当且仅当 
定义 语言是 NP 完全的当且仅当 
⑴ L^NP; 

(2) 对于所有 // GNP 有// oc p Lo 

如果有一个语言 I 满足 t 述性质(2〉，但不一定满足性质（1)，则称该语言是 NP 难的。 
所有 NP 完全语言构成的语言类称为 NP 完全语言类， C 为 NPC , 由 NPC 类语言的定义可以 
看出，它们是 NP 类中最难的问题，也是研究 P 类与 NP 类的关系的核心所在。 

定理 9-2 设 L 是 NP 完全的，则 

(1) tep 当 a 仅当 ^ = NP ； 

(2) 若 LocA ，且 MeNP ， 则 LiSNP 完全的。 

证明： U ) = 则 S 然 iePc 反之，设 L ^ PJ \\ M 6 NP ， 则 A 可在多项式时间 
P 、 内被确定性图灵机 A / 所接受。又由 i 的 NP 完全性知心 oc〆 ， 即存在映射/，使 

^ - /( ^l)o 

设 iV 是在多项式时间&内计算/的确定性图灵机。我们用图灵机 M 和/ V 构造识别语 
言心的算法 A 如下： 

① 对于输人心用/ V 在 /> 2 ( UI ) 时间内计算出 / U ); 

② 在时间 I/U > 1内将读写头移到 /( 幻的第一个符 号处； 

③ 用 M 在时间 P ( f \ x \) 内判定 f ( x )^ L , 若 / U ) € /,，则接受 L 否则拒绝 x 。 

上述算法显然可接受语言 M ， 其计算时间为/ > 2 ( UI )+ l /( x)U pi ( f \ x \) D 由于图灵 

机一次只能在一个方格中写人一个符号，故 \ f ( x )\^\ x \^ P 2 (\ x \) 0 因此，存在多项式/■使 
得 p 2 ( Ul )+ l / U)U Pl ( f \ x \)^ r ( x) c 因此，由 M 的任意性即知 P = NP 0 
(2) 只要证明对任意的 Z / GNP ， 有 L f ^ p L l 0 由于 L 是 NP 完全的，故存在一个多项式 
时间变换/使 L =/( Z /)。 又由于，故存在一多项式时间变换 g 使 M = 因此， 

若取/和 g 的和复合函梦 h - g ( f ) Li - h ( V ) o 易知 h 为 一 多项式。因此 " oc 由 

//的任意性即知 Z ^ GNPC 。 

从定理 9-2(1) 可知,如果任一 NP 完全问题可在多项式时间内求解，则所有 NP 中的问题 
都可在多项式时间内求解。反之，若 P / NP ， 则所有 NP 完全问题都不可能在多项式时间内 
求解。 

定理 9-2(2) 实际上是证明问题的 NP 完全性的有力工具。 一 旦建立了问题 i 的 NP 完全 
性后，对于 hGNP ， 只要证明问题 L 可在多项式时间内变换为匕，即，就可证明心 
也是 NP 完全的。 

9.3.2 —些典型的 NP 完全问题 

定理 9-2 所提供的证明问题的 NP 完全性的方法只有在冇了第一个 NP 完全问题之后才 
能获得。获得“第一个 NP 完全问题”称号的是布尔表达式的可满足性问题，这就是著名的 
Cook 定理 ; 布尔表达式的可满足性问题 SAT 是 NP 完全的 。 Cook 定理的重要性是明显的，它 
给出了第一个 NP 完全问题。使得对于任何问题，只要能证明 Q^NPK SAToc p 0， 就有 
^ eNPCo 所以，人们很快就证 明了许 多其他问题的 INP 完全性。这些 NP 完全问题都是直接 
或间接地以 SAT 的 NP 完全性为基础而得到证明的。由此逐渐生长出一棵以 SAT 为树根的 
‘ 302 ■ 



NP 完全问题树。其屮每个结点代灰-个 NP 完全问题，该问题可在多项式时间内变换为它的 
任一儿子结点表示的问题 d 实际卜_，由树的连通性及多项式在复合变换 卜的 封闭性可知 .NP 
完全问题树中任一结点表示的问题町以在多项式时间内变换为它 的任- 后裔结点表示的问 
题。目前这棵 NP 完全问题树上巳有几 T ' 个结点，并还在继续生 

下面介绍这棵~1>完今树中的儿个典型的 NP 完全问题。 

(1) 合取范式的可满足性问题 CNF-SAT 

给定一个合取范式 a ，判定它是否叫满足 

如果一'1、布尔表达式是些因子和之积，则称之为合取范式，简称 CNF(Conjunctive Nor ¬ 
mal Form ) G 这里的因子是变量 a : 或 i 。例如 （ a：i + x 2 )(h + a : 3 )( 巧+ x 2 + x 3 ) 就是一个合取 
范式，而 + h 就不是合取范式。 

(2) 三元合取范式的可满足性问题 3 -SAT 

给定一个三元合取范式 a ，判定它是否可满足。 

(3) 团问题 CLIQUE 

给定一个无向图 G = ( F ， 五)和一个正整数 A ；， 判定图 G 足否包含一个 A 闭，即是否存在 
rc n = 对任意 w ,«；e r 有（一切）6五0 

(4) 顶点覆盖问题 VERTEX-COVER 

给定一个无向阁 c = { 和一个正整数 I 判定是否存在 V f Q VM r I 使得对于 

任意 u , i ；)6 瓦有 w 6 r 或 1；6 r 。 如果存在这样的 v f ，就称 r 为图 (； 的一个大小 为&的 
顶点覆盖。 

(5) 子集和问题 SUBSET-SUM 

给定整数集合 S 和一个整数 h 判定是否存在 S 的一个子集 S ' £5,使得 Y 中整数的和 
为，。 

例如，若5 = ) 1,4,16,64,256,1040,1041,1093,1284,1344: K f = 3754,则子集 S ; = U ， 
16，64，256，1040,1093，1284 1 是一个解。 

(6) 哈密顿回路问题 HAM -CYCLE 

给定无向圈 G = ( K ， 五），判定其足否含有一哈密顿 1 H ] 路。 

(7) 旅行售货员问题 TSP 

给定一个无向完全图 G = U 7 , 幻及定义在 Px K 上的一个费用函数 e 和一个整数 fc ， 判 
定 G 是否存在经过 V ’中各顷点恰好一次的回路,使得该回路的费用不超过 I 

9.4 NP 完全问题的近似算法 


迄今为止，所有的 NP 完全问题都还没有多项式时间算法 3 然而有许多 NP 完全问题具 
有很重要的实际意义，经常会遇到。对于这类问题，通常吋采取以下几种斛题策略。 

(1) 只对问题的特殊实例求解。遇到一个 NP 完全问题时，应仔细考察是否必须在最一般的 
意义下求解。也许只要针对某种特殊情形求解就够了。而在特殊情形下常可得到高效算法 c 

(2) 用动态规划法或分支限界法求解。动态规划法和分支限界法是解许多 NP 完全问题 
的有效方法。在许多情况下,它们比穷举搜索法要有效得多。 

(3) 用概率算法求解。有时可通过概率分析法来证明某个 NP 完全问题的“难”实例是很 
稀少的。因此可用概率算法来解这类 NP 完全问题，设计出在平均情况下的高效算法。 
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(4) 只求近似解 3 [ tlT - 问题的输人数据通常是用测暈的方法得到的，因此输人数据本身 
就是近似的。在实际中遇到的 NP 完全问题因此也不步求一定要获得非常精确的解答，只要 
求在一定的误差范围内的近似解就够了。许多解 MP 完全问题的近似算法可以用很少的时间 
获得一个很好的近似解。这是在实践屮解决 NP 完全问题的非常有效且实用的方法。 

(5) 用启发式方法求解。在用别的方法都不能奏效时，也可采用启发式算法来解 NP 完 
全问题。这类方法根据具体问题设计一些启发式搜索策略来寻求问题的解。在实际使用时可 
能很有效，但很难说清它的道理。 

本章主要讨论解决 NP 完全问题的近似算法。 

9.4.1 近似算法的性能 

许多 NP 完全问 题实质卜_是最优化问题，即嬰求使菜个目标函数达到最大值或最小值的 
解。不失一般性，对于确定的问题,假设其每一个可行解所对应的 H 标函数值均不小于一个确 
定的正数。 

若一个最优化问题的最优值为，，求解该问题 的一个 近似算法求得的近似最优解相应的 
目标函数值为 c ， 则将该近似算法的性能比定义为 



在通常情况下，该性能比是问题输人规模 n 的一个函数 〆 a ) ，即 


max 

这个定义对于极小化问题和极大化问题都是适用的。对于一个极大化问题，0 < C ^ 

此时近似算法的性能比，表示最优值，比近似最优值 c 大多少倍。对于一个极小化问题， 
0 < c 。 此时，近似算法的性能比表示近似最优值 c 比最 优值， 大多少倍。由 c / c * < 1 

可推出 cVc > 1，故近似算法的性能比不会小 fU —个能求得精确最优解的算法的性能比为 
1。在通常情况下，近似算法的性能比大于1。近似算法的性能比越大，它求出的近似最优解就 
越差。 

有时用相对误差来表示一个近似算法的精确程度会更方便些。若最优化问题的精确最优 
值为， ，而一个近似算法求出的近似最优值为 C , 则该近似算法的相对误差定义为 



近似算法的相对误差总足非负的。若对问题的输入规模心有一个函数 eU ) 使得 

则称 e ( n ) 为该近似算法的相对误差界。近似算法的性能比 〆 〃）与相对误差界 e («) 之间显 
然有关系： e ( n ) 名 pin ) - lo 

有许多问题的近似算法具有固定的性能比或相对误差界，即 〆 〃）或£(〃）是不随 ri 的变 
化而变化的。此时，我们用^和 e 來记性能比和相对误差界，表示它们不依赖于〜当然，还有许 
多问题没有固定性能比的多项式时间近似算法，其性能比只能随着输人规模《的增长而增大。 

对有些 NP 完全问题，可以找到这样的近似算法，其性能比可以通过增加计算量来 改进。 
也就是说在计算量和解的精确度之间有一个折衷。较少的计算量得到较粗糖的近似解，而较多 
的计算量可以获得较精确的近似解。 
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一个最优化问题的近似格式是指带有近似楕度 e > 0的一类近似算法对于固定的 
£ > 0,该近似格式表示的近似算法的相对误差界为％若对固定的 e >0和问题的一个输人规 
模为》的实例，用近似格式丧示的近似算法是多项式时间算法.则称该近似格式为多项式时间 
近似格式。 

多项式时间近似格式的计算时 H 不砬随 e 的减少而增长得太 快:、 在理想情况下，若 e 减少 
某一常数倍，近似格式的计算时 间增长 也不超过某一常数倍。换句话说，我们希望近似格式的 
计算时间是1 A 和的多项式。 

当一个问题的近似格式的计算时间是关于 1 A 和问题实例的输人规模 n 的多项式时，称 
该近似格式为一完全多项式时间近似格式，其中， e 足该近似格式的相对误差界。 

下面针对一些常见的 NP 完仝 问题来研究有效近似算法的设计与分析 方法： 

9.4.2 顶点覆盖问题的近似算法 

一个无向图 G = ( V ， E ) 的顶点覆盖是它的顶点集 F 的一个子集 V " £ 使得若 U , r ) 
是 c 的一条边，则〃 e r 或《 e 1〃。顶点覆盖【〃的大小是它所包含的顶点个数丨 r u 

前面我们将顶点覆盖问题表述为一个判定问题，并证明 r 它的 np 完全性。最优化形式的 
顶点覆盖问题是要找出图 C 的最小顶点覆盖。由于与其相应的判定问题是 NP 完全的，故最优 
化形式的顶点覆盖问题是 NP 难的。虽然要找到 G 的一个最小顶点覆盖可能是很困难的，但要 
找到一个近似最优的顶点覆盖却+太困难。下面的近似算法以无向图 C 为输入，并计算出 G 
的近似最优顶点覆盖，可以保证计算出的近似最优顶点覆盖的大小不会超过最小顶点覆盖大 
小的2倍。 


V^ertexSet approx VertexCo\er ( Graph g ) 

I 

cset = 0; 
el = g.e; 

while (el ! = 0 ) { 

从 el 中取 一 条边 ( u 、 v ); 
cstt = U ! 11 , V 1 ; 

从 el 屮删 i 与 11 和 V 相关联的所 有边; 

I 

return cset 


算法 approx Vertex Cover 用来存储顶点覆盖中的各顶点。初始时 csct 为空，然后在算法 
的循环中不断从边集 d 中选取一边（心〃），将边的端点加人屮，并将 H 中已被 W 和^覆 
盖的边删去，直至 cset ELM 盖所有的边，即为空时为止 

图 9-3 说明了算法 appmx Vertex Cover 的运行情况。其屮，阒 9-3( a ) 是作为算法输入的图 
C ,它有7个顶点和8条边。图 9-3( Id ) 表示算法选择 r 边 （ U ，并将顶点纟和 c 加入顶点覆盖 
CSe t 中，然后将 e 〗 中4顶点6和 c 相关联的边和 （ U 从 H 中删去。 
图 9-3( c ) 表示算法选择了边 ( e ，/) Jf 将顶点6和/加入顶点覆盖 utU 中。图 9-3( d ) 表示算法 
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最后选择了边 U ， g)J 13( e ) 表示算法产牛的近似最优顷点覆盖 wt ， 它由顶点 b ， c ' d ， e ， 
f , g 所组成。图 9-3( f ) 是图 C 的一个最小®点復盖，它只含冇3个顶点：心 d 和^ 



图 9-3 顶点覆盖问题的近似算法 

下面考察近似算法 approx Vertex Cover 的性能。若用4来记算法循环中选取出的边的集 
合，则4中任何两条边没有公共端点。因为算法选择了一条边，并在将其端顶点加人顶点覆盖 
集<^后，就将 H 中与该边关联的所有边从 el 中删去。因此，下一次再选出的边就与该边没有 
公共端点。由数学归纳法易知 M 中各边均没有公共端点。算法终止时有 Icsetl = 2 M I 。 另一 
方面，图 C 的任一顶点覆盖 ，一 定包含4中各边的至少一个端顶点， G 的最小顶点覆盖也不例 
外。因此，若最小顶点覆譜为 cset' 贝 lj Icsel* I M I c 由此町得 I csetI ^ 2 Icset* ! 。也就是说算 
法 approx Vertex Cover 的性能比为2。 


9.4.3 旅行售货员问题近似算法 

以最优化形式提出的旅行售货员问题可描 述为: 给定一个完全尤向图 C = ( V ,£) ，其每 
一边芒五有一非负整数费用 c (心0。我们要找出 G 的最小费用哈密顿回路。 

从实际应用中抽象出的旅行 售货员 问题常具有 一牲特 殊性质。比如，费用函数 c 往往具有 
三角不等式性质，即对任意的 3 个顷点 U t V ， U ) 〖，有 c ( u 9 w ) ^ c ( U ^ v ) + C ( U 〉 D 当图 
c 中的顶点是平面上的点，任意两顶点间的费用就是这两点 N 的欧氏距离时，费用函数 C 就具 
有三角不等式性质。 

可以证明，即使费用函数具有二角不等式性质，旅行售货员问题仍为 NP 完全问题。因此， 
不太可能找到解此问题的多项式时间算法。我们转而寻求解此问题的有效的近似算法。当费用 
函数 c 具有二角不等式性质时，我们叮以设计出-•个近似算法，其性能比为2。而对于一般情况 
下的旅行售货员问题则不可能设计出具有常数性能比的近似算法，除非 P = NP 。 

】.具有三角不等式性 质的旅 行售货员问题 

对于给定的无向图 （； ，可以利用找图 C 的最小牛成树的算法设计-个找近似最优的旅行 
售货员回路的算法。当费用函数满足三角不等式时,算法找出的旅行售货员回路的费用不会超 
过最优旅行售货员冋路费用的2倍。 

* * * * • • _ • . - . _j j • j • • • 

void approx TSP (Gragh g ) 
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(0 选择 g 的任一顶点 n 

(2) 用 Prim 算法找出带权图 g 的•棵以 r 为拫的最小生成树 T ; 

(3) 前序迥 W 树 T 得到的顶点表 L ; 

⑷将 I ■加入到表 L 的末培，按表 L 中®点次序组成回路作为计箅结果返％ 


图 9-4 说明 r 算法 approxTSP 的运行情况。 





厂 TTTH II III I 


(a) 


(b> 


( c ) 



图 9 -4旅行售货员问题的近似算法 

其中，图 9-4( a ) 表示所给的图 C 的顶 点集； 图 9-4( b ) 表示由算法找到的一棵最小牛成树 T ; 
图 94( c ) 表示对树 r 所作的前序遍历汸问各顶点的 次序； 图 9 4( d ) 表示由 r 的前序遍历顶 
点表 /. 产生的哈密顿回路//;图 9-4( e ) 是 G 的一个最小费用旅行售货员四路。 

图中各顶点表示平面上的一个点 。图中 方格的边长为 U 各顶点间的边费用为顶点间的欧 
氏距离，因而费用函数满足三角不等式。从该例算出的近似最优旅行售货员回路//叫看出，最 
小费用要比//的费用少约23%。 

由于图 C 是一个完全图，易知算法 approx TSP 的计算时间为外丨 El ) =外丨 KI 2 )。 算法 
中没有明显地用到费用函数的三角不等式性质。因此，该算法也适用于一般的旅行售货员问 
题。当费用函数满足三角不等式时，该算法具有较好的性能比，即对于任何无向完全图 C ， 算 
法具有一个常数性能比2。换句话说，若用 / T 记图 C 的最小费用旅行售货员回路，而用//记 
算法 approxTSP 计算出的近似最优的旅行售货员回路，则 c ( H ) 矣 2 c () ,其中， C ( ,4 ) = 

X ； 下面证明这一结论。 

设 r 是算法 approx TSP 计算出的图 G 的最小生成树。从 / T 中任意删去一条边后，可得 
到图 c 的一棵生成树。由于 r 是最小生成树，故有 C ( r ) < /T )。对树 r 所做的一个完全遍 
历是在访问 r 的一个顶点时列出该顶点，而在结束对 r 的一棵子树的访问并沿途返回时也列 
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出返回时经过的顶点、，设 w 是对 r 依前序所做的完全遍 Wr 例如，在图 9,4(b) 中，对 r 所做的 
完全遍历为犯= al>ohhhad<，lVjgcda。ftl T 对7’所做的完全遍历 P 经过『的每条边恰好两次，所 
以有 c( IT) = 2c( D 矣 2 c(// x )。然而 TF 还+足一个旅行售货员回路，它访问了图 G 中某些 
顶点多次。由于费用函数满足」角不等式，我们可以在 W 的基础上，从中删去已访问过的顶 
点，而不会增加旅行费用。若在『中删去顶点 u 和间的一个顶点〃，就用边（心 w) 代替原来 
从1^到《;的一条路。反复用这个办法删去『中多次访问的顶点可得到 (； 的一条旅行售货员回 
路。在图 9-4 所示的例子中，从 IT 中删上重复访问顶点后得到的回路为// = atehdefga。 这就 
是算法 appn> x TSP 计算出的近似最优哈密顿回路。由费用函数的二角不等式性质即知 
c ( H ) ^ c ( W ) ^ 2 c ( H *), 也就是说，算法 approxTSP 的性能比为2。 

2. 一 般的旅行售货员问题 


尽管算法 approxTSP 也可用于解一般的旅行售货员问题，但我们不能保证它具有好的性 
能比。在费用函数不一定满足三角不等式时，不存在 R 冇常数性能比的解 TSP 问题的多项式 
时间近似算法，除非 P = NP 。 换句话说，若/ ># NP ， 则对仟意常数1，不存在性能比为 p 的 
解旅行售货员问题的多项式时间近似算法。事实 h ， 假设有一个解旅行售货员问题的近似算法 
A 。 其性能比为 p 多1。+失一般性，可设 f 为一 IH 整数，因若不然， Pj ' fflr />1来代替…在 这个假 
设下，我们可以利用算法 A 来设计一个解哈密顿回路问题的多项式时 间算法 。由于哈密顿回路 
问题是 NP 完全的，故找到了它的一个多项式时间算法就证明了 P = NP 。 因此，在尸# NP 的 
前提下，对任意 O 1这样的算法 A 是不存在的。 

下面说明如何用算法 A 来解哈密顿回路问题:设图 C = ( K ，/0 是哈密顿回路问题的一 
个实例，要求判定 G 是否有一条哈密顿回路。为了利用算法 A 来解 C 的哈密顿回路问题，将 C 
变换为旅行售货员问题的一个实例 〈 Cl ， c 〉 如下。其中 ， Gi 是顶点集 F 上的一个完全图，即 
G 1 = ( V , E ]) y E \ = \( u 9 v ) I u，v 6 F 且 w # v } ^ El 中每一边的费用 c («, i ;) 定义为 




"m+ 1 


( u f v ) e e 

( u , v ) & E \ - E 


如上定义的图 ci 和费用函数 c 显然吋根据图 g 在关于 I n 和丨 / n 的多项式时间内构 


造出来。 

现在考虑旅行售货员问题〈 C 1 ，若原图 c 有一哈密顿回路 tf ， 则费用函数 c 赋给//中 
每边的费用均为1。因此（以，0含有一个费用为 I V i 的旅行售货员问路。兄一方面，若 g 中不 
存在哈密顿回路，则 ci 的仟一回路必用到了不在£中的边。因此， < Gl , c 〉 的任一旅行售货员 
回路的费用至少为 （p W \+\) + ( W \- l ) > p \ V\c 

若用算法 A 来解旅行售货员问题< C 1， d ，则它求出的近似最优的旅行售货员回路//的 
费用 c (//) 不超过最优旅行售货员回路 / r 的费用的 p 倍，即 (人 h ) ( pcin 

当 C 有哈密顿回路//时，易知 c ( w ) = c ( fT ) = \ n ， 而由算法 A 找到的旅行售货员回 
路//的费用 c (//) 矣％ ur ) = pi h 。 由上面的分析可知，//中每 • •条边均属于故斤也 
是 G 的一条哈密顿回路。 


反之，若算法 A 找出的旅行售货员回路的费用 K //) > p \ V\Mp I Fl < c ( H ) ^ 
由此可知 c (/r) >i fi ， 即 〈cud 的最优旅行售货员回路 /r 的费用 c(/r) > 

I FI 。 由上面的分析即知，此时 g 中小存在哈密顿冋路。因此，算法 A 求出的近似最优 
的旅行售货员回路//后，只要再判断一下，其费用 c ( tf ) 是否为丨 ri , 即可判定 c 是否有一条 
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哈密顿回路。由假设知，算法 A 町在多项式时间内完成，故可在多项式时间内解哈密顿回路问 
题。在 P# NP 的前提下，这是不町能、，因此，我们所假设的这样的算法 A 在 P # NP 的前提7 
也是不存在的 。 

9.4.4 集合覆盖问题的近似算法 

集合覆盖问题是一个最优化问题，其原型是多资源选择问题。集合覆盖 N 题可以看作是图 
的顶点覆盖问题的推广，它也是一个 NP 难问题。 

集合覆盖问题的一个实例〈I F> 由一个有限集I 及义 的一个子集族 F 组成。子集族 F 覆 
盖了有限集X。也就是说，X中每一元素至少属于 F 中的一个子集，即尤 = (JS。 对于厂的一个 

沃 r 

子集 C £F， 若（:中的X的子集覆盖了 1，即尤 = LLS， 则称 C 覆盖了；^集合覆盖问题就是 

se c 

要找出 F 中覆盖的最小子集，使得 

I CM ：= mini I Cl IC c Ffi.C 覆盖 A ': 

图 9-5 是集合覆盖 M 题的一个例子。 _ 

其中，用12个黑点表示集合 X , F = \ S U S 2 , 
s 3 ， s 4 , s 5 ， s 6 , L 容易看出，对于这个例子，最小 
集合覆盖为 c = { s 3 ， s 4 ， s 5 ，L 

集合覆盖问题是对许多常见的组合问题的抽 
象。例如，假设 f 表示解决某一问题所需的各种技 
巧的集合，且给定一个可用来解决该问题的人的集 
合,其中每个人掌握若干种技巧。我们希望从这些 
人的集合中选出尽可能少的人组成一个委员会，使 
得 A： 中的每一种技巧,都町以在委员会中找到掌握 图 9 - 5 集合覆盖问题的-个实例 

该技巧的人。这个问题实质上就是一个集合覆盖问题。集合覆盖问题是一个 NP 完全问题。 

对于集合覆盖问题，我们可以设计出一个简单的贪心算法，求出该问题的一个近似最优 
解。这个近似算法具有对数性能比，算法描述 如下： 

Set greedySet Cover ( X ^ F ) 

I 

% 

I 

u = x ； 

c=0； 

while (l; ! = 0 ) > 

选择 F 中使 ISHUI 最大 的子集 s ; 

LU - S; 

c-cUSs!； 

! 

I 

return C; 


在算法 greedySetCover 中，集合 （/ 用于存放在每一阶段中尚末被覆.盖的 1 中元素。集合(: 
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包含丫当前已构造的檀盖。算法的循环体是整个算法的主体。在该循环体中，首先选择 F 中覆 
盖了尽可能多的未被覆盖元素的子集 L 然后，将//屮被 S 覆盖的元素删去，并将 S 加人 C 。 算 
法结朿时， C 中包含了覆盖 Y 的 F 的一个子集族。例如，对于图 9-5 中的例子，算法 
greedySetCover 依次选出子集6'， 心，&和 &构成子集族 C 。 

算法 greedy Set Caver 的循环体最多执行 mini I A 丨， \ F \ \ 次。而循环体内的计算显然可在 
o(\x\\ 尸 1 )时间内完成。因此，算法的计算时间为 o(\x II fi minim , i / n 丨）。由此即知， 
greedySetCover 是 一 个多项式时间算法。 

从图 9-5 所给的例子以看出，算法 greedySetOmn •得到的只是集合 X 的近似最优覆盖面 
f 步考虑算法 greedySetCover 的性能比。为叙述方便，我们用 H { d ) 来记第 d 级调和数，即 

H ( d ) = 2冬。可以证明，算法 grmU ' S e tC _ r 的性能比为 //( maxilSli )。 证明过程如下。 

‘；1 1 Sf:} 

首先对于每一个由算法 greedySetCover 选出的集合赋予其一个费用，并将这个费用分布 
于初次被覆 盖的义 中的元素上,.然后，洱利用这些费用导出所需要的算法 gr 沈 dySelCover 的性 
能比。设&表示由算法 greedySetCover 的 while 循环所选出的第纟个子集。在算法将5 £ 加入子 
集族 c 时，赋予& •-个费用1，并将这个费用平均地分摊给&中刚被覆盖的; T 中元素，即 

5, - US y 中的元素。对每一个％ e X ，用匕表示元素 X 摊到的费用。注意，每个元素 X 在它第 
一次 ; 被覆盖时得到费用匕，且只得到一次，以后小‘再得到费用。若 a 第一次被集合 S , 覆盖，则 


C 


1 


H (A u 心 u … U Df 


算法终止时，得到子集族 C ， 其总费用为 I CI 。 这个费用分布于 I 中的各元素上，即 
IC|= 。由于 X 的最优覆盖 (T 也是 X 的一个覆盖，故 

x^- X 

ici = Sc , ^ S Ec , 

稍后还将证明，对于子集族 f 中任一子集° 


H {\ S \) 


x€S 


由此可得 


S£ C 


由此即知算法 greedy Set Cover 的性能比为 


C 


!C 


^ H ( max i I 5 I i ) 
yf f 


以下证明备 //(I 5丨）。对于任一 F 中的集合 S € F 以及 i 二 1，2 , …， I C 丨，设 


e 


认 i 


= |S - U t S ; I 是算法选择了心，5 2 ，…， S x 后， S 中尚存的未被覆盖元素的个数。其中，叫定 

义为初始 S 中未被覆盖的元素个数，即叫 = IS I 。进一步设 A 是数列 叫 ， u ih ，…中第一个 
等于0的下标 C 那么， S 中的元素被集合 U 2 ，…， &所覆盖，且巾有 - U /个 
元素被 S ; 第一次覆盖 ， i = 1,2,…， I 由此可得 




u z 


= ^ I \ - (A U h U … U Di 

由算法的贪心选择性质可知， s 所覆盖的新兀素不会比&多，否则算法将选择集合 s 而不 
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是因此 

J Si - （ 心 U A U … U D 15 ： ls t ^ (5( U s 2 U U s } JI = Ui .^ 

由此可知 

ix < i 

xfS t ^\ 

对于任意止整数 a 和 6 ，a d < 6 , 容易证明 

A 

H ( b ) - H ( a ) = 2 

利用这个不等式我们得到 1_ ~ 

< S 巧二3 - " u f )) 

xi'S ^1 〜 •-1 Ml 

= H(u q ) - H(u k ) = //(a 0 ) — //(O) 

二 / /(« 0 ) = H (\ S \) 

这就是我们要证明的不等式。 

容易证明，对于任一正整数 n 有 i/U) 矣 lim + 由 f max 1 I.S M 忘:！ A 1 ，故 

•sf / * 

H (rnax i 1 S 1 I ) ^ In 1X1+ 1 ; 闪此，也可以说，算法 greedy Set Cover 的性能比为 in 丨 I 十 1 : 

在许多实际应用中 f.S|J 是一个小常数，因此由算法 pmJySdCmer 计算出的近似最 

优集合覆盖的大小只不 i 是最优集合覆盖的大小的一个小常数倍。例如，当一个图的顶点度数 
最多为3时，用算法 grmlySetG^r 解关于这个图的顶点覆盖问题， 》J 得到一个近似最优的顶点覆 
盖，其性能比为打⑶=11/6。这比算法 appimVenexCover 算法将到的结果要稍好一呰。 

9.4.5 子集和问题的近似算法 

设子集和问题的一个实例为〈心其中， S = 丨~，^，一，^丨是一个山整数的集合^是 
一个正整数。子集和问题是要判定是否存在 S 的一个子集 S1， 使得 x :: l 

该问题是一个 NP 完全问题。在实际应用中，我们常遇到的是^优化形式的子集和问题。 
在这种情况下，要找出 S 的一个子集51，使得其和不超过/，但又尽可能地接近〖。例如，在第5 
章中已讨论过的最优装载问题实质上就是一个最优化形式的子集和问题。 

下面先提出一个解最优化形式的子集和问题的指数时间算法，然后将这个算法作适当修 
改，使它成为解子集和问题的一个完全多项式时间的近似格式。 

1.解子集和问题的指数时间算法 

设 L 是一个由正整数组成的表，: t 是 W 外一个正整数。用 L + ^来表示对表 A 中每个整数 
加后得到的新表。例如，若 i = <1，2,3,5,9>,则(3,4,5,7，〗1〉 2 对于整数集合 S, 
用记号 S + : r 来丧示集合 S 中每个元素都加上X，即 S + ^ = {s + x I s 6 S U 

下面要描述的解子集和问题的算法 exactSubsetSum 以集合 S = i h 和目标值 

i 作为输入。筧法中用到将两个有序表 Li 和 Z 2 合并成 > 个新的奋序表的算法 
mergeList »( i 1 » [2)。与含并排序算法中用到的 Merge 算法类似，算法 mer ^： eLists 的计算时间 
为 0 (f Lim L 2 \) c 



int exactSuhsetSum (S 1 1) 
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int n = I S l i 
LlO / = | 0 !; 

for (int i= 1 ;i < ^ tt；i + + ) i 

L|_i] = nierpLists(Ll_i - lj + S[i ])； 

删去 UiJ 中超过 t 的元 素; 

I 

r 

return max(L»; 


用 / V 表示 U ! 32,…， a ! 的所有可能的子集和，即 h 中 的一个元素是 U 3 ， h ， …， A 丨的 
一个子集和。约定一个空集的子集和为0,并约定 P G = I 0 L 不难用数学归纳法 证明： 

Pi = U (/ > A _1 + x { ), i = 1，2, … "I 

例如，若 S = U ，4,5 i ， 则 P 0 = ]0|； P , = |0 T lj ； P 2 = |0, l ,4,5 i ; P 3 = 10,1,4,5,6, 
9,10 i o 

由此易知，算法 exactSuUetSum 中的表 L [;] 是〜个包含了 P ,. 中所有不超过 f 的元素的有 
序表因此， L [ n ] 中的最大元素 max ( L [ n ]) 就是 S 中不超过 f 的最大子集和。 

由于 A 中包含了所有可能的的子集和，因此 丨61= 2、在最坏情况下, 

L [/] 可能与&相同。因此，在最坏情况下 | L [ i ] | = 2、由此可知，在一般情况下，算法 
exactSubsetSum 是一个指数时间算法。 

2. 子集和问题的完全多项式时间近似格式 

基于算法 exaotSuteetSum ， 通过对表 L [ G 作适当的修整建立一个子集和问题的完全多项式 
时间近似格式。在对表 L [ i ] 进行修整时，要用到一个修整参数5,0 < 5 < 1。用参数 S 修整一 
个表 i 是指从 t 中删去尽可能多的元素，使得每一个从 L 中删去的元素 y ， 都有一个修整后的 
表 L 1 中的元素 z 满足 （1 -^) r ^ 可以将 z 看作是被删去元素^在修整后的新表 L 1 

中的代表。也就是说，对每一个删去元素 y ， 可以用新表 U 中一个元素^来代表 y ， 使得 I 相对 
于: K 的相对误差不超过夂 

例如，若沒= 0,1，且 i = <10，11，12，15,20,21，22,23,24,29>，则用5对1进行修整后得 
到尤卜<10，12，15,20,23,29>。其中被删去的数】！由10来代表，21和22由20来代表，24由 
23来代表。 

经修整后的新表 L 1 中的元素也是原表 t 中的元素。对一个表进行修整后，可大大减少其 

中的元素个数，而对每个被删除的元素保留一个与其很接近的代表，以控制计算结果的相对误 
差。 

下面的算法 trim 对有序表 A 进行修整，它以有序表/, ：=〈1^，"_,“>作为输人，1中 
元素以非减次序排列。 

. .. . -- - ' —— •- - v.V . . 

List trim ( L , S ) 
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u =〖 lLi]'; 

int last = 1 _; 

for (int i ^ 2;i < = m;i + + ) : 

if (lasl < (!-&)« f,[i]) 

将 Uij 加人表 LI 的尾郎； 
la^t = LLi .; 

I 

I 

return LI; 

I 

0 ■ ■ ■ ■ ■ 

在算法 trim 中，以递增的次序逐个扫描表 L 中的元素,、当被扫描元素是表 L 中第一个元 
素或被扫描元素不能用最近加人新表 L 的元素 last 代表时，将被扫描元素加入新表 L 1 的尾 
部眉 能够被 W 代表的元素不加入 U ， 意味着该元素被删左。算法 iHm 的计算时问为 W m ) 、 
由算法 trim 可以构造子集和问题的近似格式 approxSubsetSum 如下。该近似格式的输入 
参数是/ I 个整数的集合 S = U ,,; v 2 ，…，&1、目标整数/和一个近似参 数？， 0 < € < U 

__ j • • • r • • ■藝 澹 •暴 •》_ 馨 馨讎 ^ | m || 

int approx Subset Sum (S , l,e) 

I 

I 

n = I SI; 

UO] = (0); 

for (int i = l;i < = lui + 十 〉 I 

L[i] - merge Lis ts(L[i - 1J , L.i - 1」 + S[i]); 

L[i] = tritn(Li i] ,e/n) ； 

删去 L[i] 中超过 l 的元素； 

I 

I 

return max(L[n 」）； 

I 

I 

■ ■■■ ■ ■■■ _ 谷谷 ■■■ 馨 ■ ■■■， ■ ■ 參讎 ■ _ 

在上述算法中 ，菏先 将 L [ o ] 初始化为只含一个0元素的表。然后在算法的主循环中逐次 
计算表 L [ i],i =： 1,2,…，〜计算出的表 L [ i ] 实际上就是对集合6进行修整后的有序表，修 
整参数为 S 二 以〜另外， L [〖] 中已将超过目标整数【的元素及时删除，以减少不必要的计算、 
我们用 一 个例子来说明 approxSubsetSum 的运行情况。在该例中 ， S 〈 104, 102.201 ， 
101)^ ^ 308,^ ^ 0.2。由算法确定的修整参数5是 e /4 = 0,05、:初始时,1彳0]= <0>。在算法 
的主循环中逐次计算出 L [1]， L [2]， L 〔3] 和 L [4]。 每次计算经过合并、修整和删除大于 < 的元 
素3个阶段 。 现将算法汁算 L [ f ]，（ = 1，2,3,4的3个阶段的计算结果列出 如下： 

T」[l: = (0,104)； 

L[l] = (0,104); 

L[lj ^ (0,104)； 

L[2] = (0,102,104,206); 

L：2； = (0,102,206h 
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J ,[2] ^ <0,102,206；; 

L [3] = (0,102,201,206,303,407)； 

L [3] = <0， i 02,20 i ，303,407); 

L [3] = (0,102,201,303)； 

L [4] = <0,101,102,201,203,302,303,404)； 

L [4] = (0,101,201,302,404)； 

L [4] = <0,101,201,302)； 

算法最后返回 z = 302 作为近似解答。容易看出，该例的最优解为104+102+101 = 3070 
近似解的相对误差在2%以内。在理论上，算法可以保证对子集和问题的任一实例可用，其相 
对误差在 e 之内。 

下面进一步讨论算法 approxSubsetSum 的性能。通过分析可以得出如下结论： 

(1) 算法 approxSubsetSum 计算出的近似解是 S 的一个子集和，它关于最优解的相对误差 
不超过预先给定的误差界 e 。 

(2) 算法 approxSubsetSum 是子集和问题的一个完全多项式时间近似格式，即它的计算时 
间是关于输入规模 a 和 1/ e 的多项式。 

首先注意到，算法中对 L [ i ] 进行修整，并将其中超过 I 的元素删去后， L [ j ] 中每个元素仍 
为集合&的成员。因此，算法返回的 z 值是的成员，从而它是 S 的一个子集和。若设子集和 

问题的最优值为 C * ，则算法返回的近似最优值 z 与 f 的相对误差为= 1 - f 。我们 

要证明这个相对误差不超过^即1矣 e 。 这等价于 z 。注意到在对 LM 

进行修整时，被删除元素与其代表元素的相对误差不超过对修整 次数纟 用数学归纳法容 
易证明，对于 A 中任一不超过 f 的元素 y ， 有 L [ i ] 中一个元素^使得 ( l - eAi ) y 在^ ^ ro 
由于最优值 C * G />„，故存在 xGLU ]， 使得^ ^ ^ C 、 又因为算法返回的 
是 L [ n ] 中最大元素 2 ， 故有； c 矣 z 矣 C # 。因此 ，（ l - s / n ) W 矣 z 最后，由于 
(1 - £々产是戊的递增函数，因此，当 n > 1时，有 （1 - e ) ^ (1 - e / n )% 由此可得， 
(1 - e )^ 1 " ^ ^ ^ 这就证明了算法 approxSubsetSum 返冋的近似最优值^关于最优值 

r 的相对误差不超过 e 。 

从算法 approxSubsetSum 的循环体可以看出，每次对有序表 L [ i ] 所作的合并、修整和删除 
超过！的元素的计算时间为0 (丨 L [ i ] 丨 ） 。 因此,整个算法的计算时间不会超过 0 (n IL [/ i ] l)o 
注意到算法对表 Ui ] 进行修整后，表中相继元素 a 和6间满足 a /6 > 〖/( i - e / rt )。 也就是说, 
表 L [ i ] 相继元素间至少相差一个比例因子 1/(1 - 而表 L [ i ] 中最大数不会超过 b 因 
此,算法完成了对 U /] 的合并、修整和删除超过/的元素等操作后， L [ U 中元素个数不超过 

ln ^ ___ IrU 」一一 nt 

ln ( 1/( l - g / zi )) — - ln ( 1 - E/n ) ^ e / /i — e 

特别地 ， I L [ n ] | ^ 于是，算法 approxSubsetSum 的计算时间为0 ( n 2 / e )。 这表明它是 

E * 

一个完全多项式时间近似格式。 

习题9 


9^1试写出完成下面计算的 RAM 和 RASP 程序: 
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(1) 给定输人 n ,汁算 / I!c 

(2) 读人 u 个 fF _ 整数(用 () 做结束标忐 ） ，然后，按从大到小的顺序输出这〃个数。 

9-2 用对数耗费和均匀耗费两种标准分析习题9 - 1中枵序的时间和苹间 S 杂件 

9-3 写出一个计算 W 的 KAM 程序，要求该程序在均匀耗费标准下的时间 复杂性 为 
OOugrO >并证明程序的正确性。 

9^4设问题 P 关于文例/的精确解为，（？），解问题 P 的近似算法 A 对于实例/得到的 
近似解为4 /) ( 如渠存在-常数 M 吏得对 f P 的仟何实例/均有 

\ c *{/) - (.•(/) I ^ k 
则称算法 A 是解问题 P 的绝对近似格式 

平面阁的色数问题是对于给定的平面图: ( K ， F )， 确定对其®点着色的最小色数.试 
设计解平面图着色问题的一个多项式时 M 绝对近似算法 A 使得 1^(/) - c ( I )\^ 1, 

9^5设冶 n 个程序 U 2, …， 〃要#人两张 容髮为 / W 的磁盘中。第；个程庁耑要的存储空 
间为 ％ d = 1,2, …，％ 设计•-个算法计算出这两张磁盘能存放的最多程序个数、 

(1) 证明 i :. 述问题是 NP 难的 

(2) 下面的算法 pStore 是解 L 述问题的一个绝对近似算法： 

int pSUire(int n. int maxM. int 、 m) 

I 

i 

I 

sort( iti, n) ; // 将 m 从小到人排序 

inf i = 1 ; 

fur (ml j = I ;j < = 2 ;j + + ) i 
mt sura = 0; 

while (^uiri + mLij < = max.M) I 

System.out, println("sort program" + i + "on disk" + j); 
sum + = mill ; 
if (… ii) return i; 

i + + ; 


return i 一 l : 


试证明对于 L 述算法 pSture 有 \ c ^( l ) - c (!)\^ J, 

9-6 以计一个有效的贪心算法，使其能在线性时间内找到一棵树的最优顶点覆盖。 

9-7 解顶点覆盖问题的一个启发式算法如下:每次选择具有最高度数的顶点，然后将与 
其关联的所有边删去。举例说明该算法的性能比将大于2、. 

9-8 一个图 C 的最优顶点覆盖是其补阉中最大团集的补集。这个关系迠否喑示对于闭 
问题也有一个常数性能比的近似算法？ 

9-9 试设计解 TSP 问题的 0 (^) 时间近 似算法，使其性能比达到1 .5: 

9-10 证明旅行售货员问题的一个实例可在多项式时间内变换为该问题的另一个实例， 
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使得其费用函数满足二角不等式，且两实例 U 冇相同的最优解 .、说 明是杏可以通过这个变换使 
得--般的旅行售货员问题具有- * 个常数性能比的近似算法。 

9-11 瓶颈旅行售货员问题是嬰找出图 C 的一条哈密顿回路，吐使回路中最长边的长度 
最小。若费用函数满足三角不等式，给出解此问题的性能比为3的近似算法(提示 ：递！ H 地证 
明，可以通过对的最小生成树进行完全遍历并跳过某些顶点，但不能跳过多于两个连续的 
中间顶点，以此方式来访问最小生成树中每个顶点恰好一次)。 

9-12 若旅行售货员问题中，图 C 的各顶点均为平时匕的点， ti 费用函数定义为 
点 u 和 。之 间的欧氏距离，证明 （； 的一个最优旅行售 货员回 路不会自相交 c 

9-)3 试说明如何实现算法 greedy Set Co 使其计算时 N 为 E \ S \) . 

r 

9-14 试给出一族集合覆盖问题的实例，用以说明算法 greedySetCover 可以产生的不同 
解的个数随实例规模指数增长。这里所说的不同解是指算法 greedySelCover 在作贪心选择时 
可以有多种选择，即使 IS D 丨最大的子集可有多个时，不同的选择导致算法的一个不同 
的解。 

9' 15如何修改近似算法 approxSubsenSum , 使其可以找出子集和不小于 f 的最小子 
集和？ 

9 M 6 多机调度问题。设有 m 台完全相同的机器来完成 n 个彼此独立的任务，第纟个任 
务所需的机器时间为= l ，2，一, i 我们要确定一个时间表，使仝部 n 个任务都结束的时 
间最短。 

解上 述问题 的最长处理时间算法 LPT 每次从待安排任务屮选择最长处理时间的仟务，并 
安排给一台完全空闲机器。试在 OUiog 幻时间内实现算法 LFT ， 并证明该算法所得到的解的 
相对误差 



9-17 LPT 算法的最坏情况实例。设 n = 2 m + i E G = 2 m - l(i + l )/2 j , 1 ^ i 
t 2m + i = 试构造多机调度问题关于该实例的最优解，和用算法 LPT 求出的解 c ， 并计算近 

似算法 LPT 的性能比 



9-18 设在多机调度问题中，要在所给 m 台机器 t 安排的〃个任务已按各自所需处理时 
间的递减序列排列 hQ 多…奋解此问题的算法 LPT 2 先确定一个正整数 A '， 对前个 
任务求最优安排，然后对后 n - A 个任务用算法0^(习题9-16)求解。 

(1) 试证明算法 LPT 2 的解的相对误差 

】 1 ^ 1/m 

^ 1 +1_众/爪」 

(2) 根据 (1) 的结论，设计一个解多机调度问题的多项式时间近似算法，对于给定的 
£ > 0,算法所需的计算时间为 0( nloga + 

9 - 19 设 a 是一个含有 ri 个变量和 m 个合取项的合取范式。关于 0 的最大可满足性问题 
要求确定 a 的最多个数的合取式，并使这些合取式可同时满足。 设&是 a 的所有合取式中因子 

个数的最小值。证明下面的解最大可满足问题的近似算法 mSAT 的相对误差为 yh。 
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Set mSAT(a) 

I // x n 1 ^ i 矣 n ， 楚 a 中 n 个令 MiC ,，] ^ i ^ 1:1，是2的111个合取项 
d 二 0; 

left = >C[ \ 1 ^ i ^ m ■; 
lit = S x,, x, I i ^ i ^ n h 

Me ( lit 含有在的合取式中出现的因子）； 

设 y 是 Ul 的在 left 的合取式中出现次数最多的因子； 

设 r 是 kft 中含有因子 y 的所有合取式的集合； 
cl = i:l U n 

left = left - r ; 
lit = lit - i y , y I ； 

I 

I 

return ( cl ); 

I 

參 

■ 

• • • • 

9-20 试证明下面的解最大吋满足问题的近似算法 mSAT 2 的相对误差为是。的所 
有合取式中因子个数的最小值。 

»»» • ,摩 9 參 _1 

• _ _ 

Set mSAT 2( a ) 

i // Xj , 1矣 i 矣 n , 是 a 中 n 个变1备 U m , 是 a 的 m 个合取项 

for (iat i - 1 ji < = m ; i + 十） w _ i ] = 2' lc i'; 

cl = 0; 

left - ! ci I 1 ^ i ^ m I ; 
lit = i x it Xj I 1 ^ i ^ n }; 

wh 如 （ lit 含有在 left 的合取式中出现的因子 ）I 
设 y 是 1 U 的在 left 的合取式中出现的因子； 

设 r 是 left 中含有因 7 S 的所有合取式的集合； 

设 6 是純中含有因子；的所有合取式的集合； 

if(^] 、 v[i:. 5 ： w[i]) i 

<•6 ， C. 

I L 

cl = cl U r ; 
lefl = left - r ; 

对所有 G s , w [ i ] = 2> w [ i ]; 


else i 

cl = cjI U s; 
left = left - s; 

对所有 f_ G r，wLiJ = 2 w[i ]； 
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return (cl); 



附录 C ++ 概要 


本附录将简劫介绍 c + +语言的基木知识。 

1,变量、指针和引用 

(1) 变量 

变暈是程序设计语言对存储黾元的抽象，它具有以下 属性： 

变量名 （ name ) 变 M 名是用于标识 变量的 符号。 

地址 ( address ) 地址是变量所占据的存储单 7 C 的地址。变量的地址属性也称为左值。 
大小 ( size ) 变量的大小指该变暈所占据的存储空间的数量(以字节数来衡 M )。 

类型 ( type ) 变暈的类型指变 量所取 的值域以及对变量所能执行的运算集、、 

值 ( value ) 变量的值是指变量所占据的存储单元中的内容、这些内容的意义由变量的 
类型所决定。变量的值属性也称为 右值. 

生命期 ( lifetime 〉 变量的生命期是指在执行程序期间变量存在的时段、 

作用域 ( scope ) 变 M 的作用域是指在程序中变量被引用的语句范凼。 

(2) 指针变量 

C ++ 中的指针变量是一个 Type * 类型的变量，其中 Type 为仟一已定义的类型。指针 
变量用于存放对象的存储地址。例如： 

v • • I 泰 • • • _ 

int n = 8 ; 

* p ； 

p= &n; 
int k = * p ； 

§ • 垂籲 _ • iii 瓤|參》 _ •• 

其中， P 是一个指向 im 类型的指针。通过间接引用指针来存取指针所指向的变 

(3) 引用 

在 C + +中,引用足变讀的一个替代名。引用的定义与变 ft 的定义很相似，但引用不是 
变量。 

Type &表示对一个类型为 Type 的变量的引用。 例如： 

• _ • 

int i = 5； 

int &j = i:. 

i = 7; 

coat < <i< < endli 
coat < c j < < endU 

其中， i 是对变量 i 的一个引用。当；的值改变时,」的值也跟着改变。因此，上面的输出语句输 
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出的 i 和 j 的值都& 7。 

2 . 函数与参数传递 


⑴函数 

C + + 中有两种函数 : 常规函数和成 W 函数。不论哪种函数，其定义都包括4个部 分：函 
数名、形式参数表、返回类型和函数体。函数的使用者通过函数名来调用该函数。调用函数 
时，将实际参数传递给形式参数作为函数的输人。函数体中的处理程序实现该函数的功能 D 
最后将得到的结果作为返回值输出。例如，下面的函数 max 是一个简笮函数的例子。 

• • ■ •••• ••••« • • • • • 1 • • • ^ • • • •• • jji« * •• rrrj«jr« 

int raax(int x ,int y) 

1 retUTTl x > y 7 x ： y ； 


其中， max 是函 数名； 函数名后圆括号中的 int x 和 int y 是形式 参数； 函数名前面的 iM 是返回 
类型; 花括号内是函数体，它实现函数的具体功能。 

O +中函数一般都有一个返回值。函数的返回值表示函数的计算结果或函数执行状 
态。如果所定义的函数不需要返回值，可使用 void 来表示它的返回类型。函数的返回值通过 
函数体中的 return 语句返回。 return 语句的作用是返回一个与返回类型相同类型的值，并中 
止函数的执行。 

(2) 参数传递 

在 C + + 中凋用函数时传递给形参表的实参必须与形参在类型、个数、顺序上保持一致。 
参数传递有两种方式。 一 种是按值传递方式。在这种参数传递方式下，把实参的值传递给函 
数局部工作区相应的副本中。函数使用副本执行必要的 计算。 因此函数实际修改的是副本的 
值，实参的值不变。 

参数传递的 M —种方式是按引用传递参数。在这种参数传递方式下，需将形参声明为引 
用类型，即在参数名前加上符号“&”。当一个实参与一个引用类型结合时，被传递的不是实参 
的值，而是实参的地址。函数通过地址存取被引用的实参。执行函数调用后，实参的值将发生 
改变。 例如： 


void Swap(int &x，int &y) 


irit temp = x; 


y = temp ； 


函数调用 Swa p ( x ， y )3 换变董 X 和 y 的值。 

在 c + + 中数组参数的传递属特殊情形。数组作为形参可按值传递方式声明，但事实上 
釆用引用方式传递。实际传递的是数组第一个元素的地址。因此在函数体内对于形参数组所 
作的任何改变都会在实参数组中反映出来。 

若传递给函数的实参是一个对象(作为类的实例），在函数中就创建了该对象的一个副本 D 
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在创建这个副本 时不调爪 该对象的构造函数， m 在函数调用结屯前要调用该剐木的析构函数 
撤销这个副本。若采用引用方式伶递对象，在函数中不创建该对象的副本.因和也不需撤销副 
本。但函数将改变引 m 传递的对象、 

3. C + +的类 


C ++ 的类 ( class ) 体现 r 抽象数据类型 ( ADT ) 的思想，它将说明与实现分离。 

C + + 的类巾4个部分 组成： 

(0 类名; 

(2) 数据成 M ; 

(3) 函数成 K (也称成员函 数）； 

(4) 访问 级别。 

对类成员的 i 方问 有3种不 | iT ] 的级别:公有 （ puWk _) 、私有 （pri Vilte ) 和保护 （ protected ) 级别。 
在 public 域中卢明的数据成员和函数成员可以在程序的任何部分访问；在 private 和 protected 
域巾声明的数据成员和函数成员构成类的私有部分，只能由该类的对象和成 W 函数，以及被声 
明为友员 （ Wend ) 的函数或类的对象对它们进行访问。此外，在 pMected 域中卢明的数据成 

M 和函数成 5 i 还允许该类的子类汸 M 它们。下时足 C 十+中定义的矩形类 Rectangle 的例子 c 

• • • • • • 

class Rectangle ^ 


public ： 

Rectan^le(int. int»intfinl); 

〜 Kectangle(); 
int GetHei^ht(); 
int GetWidth(); 


// 构造函数 
// 析构函数 
//矩形的高 
//矩形的宽 



int xl ， vl ， li ， w; 


// ( xl ， yl ) 是矩形左 K 角点的 坐标; 
// h 是矩形的髙； w 是矩形的宽， 



Rectangle ： : CetHeight() In-turn h; i // 返回矩形的高 
Kftctangle： : idth() \ return w; i // 返问矩形的宽 

I 9 

4. 类的对象 

下面的代码段说明了如何声明类的对象，以及如何调用其成员函数。 

Rectangle r(0.0, 2,3) ; 

Rec tangle s( () ， 0 ， 3 ， 4 ) ; 

H«ctangle ^ t = 

if (r. GelHeighl() * i. Ot Width( ) > t - > Get Height () * t - > GetWkhh()) 
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cout< < "矩形 r ” ; 
elst* cout< < "矩形 s "; 
cout < < "的面积较人 < < endl; 

类对象的声明与创建方式类似于变景的声明与创建方式。对一个对象成员进行访问或调 
用可采用直接选择 (0 或间接选择（- > )来实现， 

5. 构造函数与析构函数 

O 类的构造闲数 ( construct ) 用于初始化•个对象的数据成员。构造函数名与它所 
在的类名相同。构造函数必须声明为类的公冇成员函数。构造函数冇返回值也不得指明 
返冋类型。例如，类 Rectangle 的构造函数可定义 如下： 

• ^ - • • • • • • / ■ V〆 

Rectangle: : Rcctangle{int x - 0,int y = 0 f int height = O t int width = 0) 

: xl (x), yl (v)i h (bright) $ w (width) 


可用如下方式卢明 Rectangle 的对象 r ， s 和 l : 

j • j • • • ^ r • • • s ^ % •- • • • • • • r • . 9 • . 

Rectangle r(0,0,2,3); 

Rectangle *s = new Rw:tangle(0,0,3,4); 

Rectangle t; 

’ ' > • • a • • * - • • • • • - - • . , . , . r . 

析构函数 ( destriu ^ r ) 用于在 - 个对象被撤销时删除其数据成员。析构函数名也与它的 
类名相同，并在前面加卜_符号 

6. 运算符重载 

C + +允许为用户定义的数据类型重载运算符。 

下面的代码段实现对类 Rectangle 的运算符“”的重载。 

拳馨 ，籲 r ■■馨 ■馨嫌 r 馨籲 _ • • • • 參像■攀 • _ __ 

bool Rectangle ： ： operator = = (const Hectangle &s) 

5 

I 

if (this = = &r) return tn 】 e; 

if ({x 1 = = s. xl) & & (yl = = ?.) 1) & & (h = = K) & & ( w = = s. w)) relum Iru^; 

ehe return falbe; 

I 

I 

參馨 馨馨 * 馨馨 _ 參 I 

其中，用到 C + + 中的保留字 t hi Sc 在类的成贝函数内部， this 表示一个指向调用该成员函数 
的对象的指针，因此该对象也可用* thU 来表示。 

经甫载运算符“==”后，即吋用运算符“=”来判定两个 Rectangle 对象是否相同。 

7. 友元函数 

在类的声明中可使用保留字 fVi ⑼ d 来定义友元函数。友元函数实上并不是这个类的成 
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员函数。它可以是一个常规函数，也可以是另一个炎的成 W 函数如果想通过这个函数米存 
取类的私乜成员和保护成员，就必须在类的声明中给出该函数的原型，并在前面加上 fricmU 


8. 内联函数 

在函数定义前加上一个 inline 前缀，该函数就被定义成一个内联函数。内联涵数的保留 
字 inline 告诉编作器在任何调用该内联函数的地方直接插入内联函数的函数体 

9. 结构 

在 C + +中,.结构 ( struc t ) 与类的区别是，在结构屮默认的汸 M 级别是 public , 而在类中默 
认的防问级别是 private 。 除此之外， struct 与 class 是节 价的。 

10. 联合 

联合 （ imion ) 是-种结构。在 C + +中，联合可以包 含变量 和函数，还可以包含构造函数 
与析构函数。因此，可以用联合来定义类。 C + +的联合保留了所有 C 的特性，其中最重要的 
是让所有数据成员共莩相 N 的存储地址。与结构类似，联合的默认访问级别足 public , 

在使用 C + + 的联合时应注意，联合+能继承其他任何类型 的类; 联合不能是苯类 ，+能 
包含虚成员 函数; 联合不能含有静态变量；如果一个对象有构造函数与析构凼数，那么它不能 
成为联合的 成员; 如果一个对象重载 f 运算符“=”，它也不能成为联合的成 

11. 异常 

c + + 的异常 ( excep i Km ) 提供 r ‘种处理错误的简捷方法。当程序发现一个错误，就引发 
一个异常,以便在程序最合适的地方捕获异常并进行处理。在 C + +中，异常是一个对象 •它 
是从基类 exception 派生出来的 t 程序通过 throw 来引发异常。例如： 

• % s % % m % n % • * • • • • • ^ • • • • k. k • • • * • • * 1 

class error ) | ; 

\oid f ( void ) 


throw error(); 


ifuow 语句类似于 return 语句，何它描述函数的异常终止。异常处理桿序通常用一个 try 
块来定义。在引发异常之前，程序一直执行 try 块体。在 try 块体之后有一个或多个舁常处理 
程序。每一个异常处理程序由一个 catch 语句 组成。 这个语句指明欲捕获的异常以及出现该 
异常时要执行的代码块。当 try 引发了 一个已 定义的异常时，控制就转移到相成的异常处理 
程序中。 

. - ' 

void g( void) 






catcb (error) I 

兄常处理 程序; 

1 

catch (error 1) | 

异常处理 程序; 


12 .模板 

模板 ( template ) 是 C + +提供的一种新机制，用于增强类和函数的可重用性。 

在前面讨论的函数 max 中,有两个 im 类型的参数 a 和 b 。 函数 max 返回 a 、 b 二者中较大 
者。如果还要求两个 double 类型对象中的较大者，就需要重新定义函数 max 。 通过使用模板， 
可以定义一个通用的函数 nmx 如下： 

v •丨 j •• rj • • • 鬌•攀 ** w * *• •• • ^ ^ m • *〆/••••••••••• ■ * • • A. • • • • s • • • • 

template < class Type> 

Type max(Type x，Type y) 


return x> y ? x ： y ； 

[ 

* 八 ■_ < 以 vrijj 參，，•户 ，春參 •一 S 馨參 j 鲁，，鬌 _«%«.« - • • • • • i .. % % • • • • ••****_ 气_働 、《• J | • • 

上述模板定义了一个 max 函数的家族系列，它们分别对应于不同的类型 T ype 。 编译器根 
据需要创建适当的 max 函数。例如，下面的语句 

•% 〆 蒙 ， • • • • -w» ^ j %>i ， • • m m ms • ， _ • ••雜 • • •^•••••4 1 . ^ m m 9 % • •• • • iji r^r^r •••••/ 91/ 

inr i = max ( 1,2); 
double x = max ( 1.0,2.0); 

将创建两个 max 函数。其中之一的参数类型为 int ， 另一个的参数类型为 double ^ 

除了定义通用函数外，模板还可用于定义通用类。 例如： 

k ^ t % W S ^ 、龜 \ _ •• 瓤—鉍禱 • J • ， 卢 ^ J • • • • ^ J •■••、』 m ^ * m • • J • _ m m m Ikll arir _ 

class Stack 

J 

public ： 

void Pushl int x); 
int * Pop(int& x); 
private : 
int lop ； 
int * stack; 
int MaxSize; 

i ； 

• • • • ■■一 ■參 ■馨 ■■ • • • • • • • _參 
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这个 Stack 类描述了一个整数栈。其成员函数 Push 和 Pop 分別用于从栈中插入和删除 
一个 W 类型的对象。如果要求使用不同元素类型的栈，就必须写一个小'同的 Stack 类，通过 
使用模板，我们可以定义一个通用的找类 如下： 


template < rlass Type > 
class Sta^k 

public: 

Slack(int MaxStackSize= 100) i 

bool IsFullO; 

bool Is Empty (); 

void Push(const Tyf^& x); 

Type * Pop(Type& x); 
private: 
int top ； 

Type * stack; 

int MaxSize; 
f ； 

template < c1hs& Type > 

Stack < Type > :: Stack(int MaxStackSize) : Max Size (MaxStackSize) 

! 

i 

stack = new Type[ MaxSize 」； 
top = ^ I; 

template < class Type > 

inline bool Stack < Type > :: IsFull() 

I 

if (top= = MaxSize - 1) return Uue; 
else return false; 


template < class T ypp > 

inline bool Stack < Type > ;; lsEmpty() 

I 

4 

I 

if (top = - - 1) return true; 
else return false; 


template < cla&s Type > 

void Stack < Tvpe > :: Push(const Type& x) 
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if (IsFullO) StackFullO; 

else stackf + + tupl = x; 


= 10； 

iril * v = new int (10); 

▲ 

int * v ; 


V = new int ( 10); 

(2) —维数组 

为了在运行时创建一个大小 4 动态变化的一维浮点数组 X , M 〖先将 x 声明为一个 float 类 
型的指针 r 然后用 new 为数绀动态地分配存储空间。例如 

float * x = new float [ n ]； 

将创建一个大小为〃的一维浮点数组。运算符 na 分配《个浮点数所需的空间，并返回 
指向第一个浮点数的指针。然;5町用 x [0] ， x [ 1 ] ，… . x [ n _ 1 ?来访问每个数组元素。 

(3) 运算符 delete 

当动态分配的存储空间已不再需要吋应及吋释放所占用的宁间。在 C + +中，用运算符 
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template < class Tvpc> 

Type ^ Stack < Typ<f> ：; Pop(Tvpe& \) 

% 

\ 

if (EsEmpty()) } StarkEmpty(); return 0;: 
x = stackL top - - J; 
return &x; 

! 

下面的语句创建两个找类 Stack < int >和 Stack < double > : 

jii • I • • • • • • 

Stack < int > S( 1000) i 
Stark < double> T(1000) ; 

13. 动态存储分配 

(1) 运算符 new 

C + +的运算符 new 可用于动态存储分配。该运算符返 lH | — 个指向所分配空间的指针。 
例如，要为一个整数动态分配存储空间，可以用下面的语句说明一个整型指针变量 int * x ; 当 
需要使用该整数时，用下面的语句为它分配存储空间 

y = new int ; 

为了在刚分配的空间中存储一个整数值10,用 K 向的语句实现 

- x y = 10; 

上述各语句的3种等价表达方式 如下： 

int * y = new int; 


* 或或 



deleu ‘来释放巾 ne 、 v 分配的空例如 

delete y ; 
delete [] x ^ 

分别释放分配给* V 的空间和分配给一维数组 X 的空间。 

W 

(4) 二维数组 

C + + 提供/ 多种声明二维数绀的机制。在许多情况下 ，卡形 式参数是一个二维数组时, 
必须指定其笫二维的大小。例如, a [][10] 是一个合法的形式参数，而 a 「][] 则4、'是:> 为了克 
服这种限制，可以使用动态分配的二维数组。例如，下面的代码创建一个类型为 Type 的动态 
工作数组，这个数组有 rows 行和 crds 列 c 

• • • _ 

template < cla^s Type > 

void Make2DArray(Type^ ^ &x，int rows，int cols) 

I 

x = new Type ★ [ rows 」； 
for (ini i - 0 ;i < rows;i + 十） 
x . i ] = new Typp [ cols ]; 

• • 蜃, • • 

当不冉需要一个动态分配的二维数组时，叫按以下步骤释放它所占用的空间。首先释放 
在 for 循环中为每一行所分配的空间。然后释放为行指针分配的空间。 H 体实现可描述 
如下： 

^ • • • • • • ^ • • • 

template < class Type > 

void Dd ^ te 2 DArray ( Type * ^ & x ， inlrows ) 

I 

for (int i = 0; i < rows;i + + ) 
delete [ 1 x " i ]； 

delete [ ]x; 

x = 0; 


注意在释放空间后将 x 置为0,以防止用户继续访问已被释放的 空间: 
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